Wartegg, en kommentar till kommentaren

Jarna Soilevuo Grønnerød and Cato Grønnerød kommenterar på sin egen Wartegg blogg Psychometrics inlägg om att det är tveksamt att använda Wartegg som beslutsunderlag vid urval. Jarna och Cato håller med om att det är tveksamma bevis för att Wartegg kan användas vid urval.

”We agree that these studies do not provide an adequate base for the use of the WZT as a selection instrument” (http://wartegg.tumblr.com/post/28405225737/recent-discussion-on-the-wartegg-as-a-selection).

Som Psychometrics påpekat är underlaget bristfälligt, endast 122 individer ingår i det underlag som som ligger till grund för evidens. Detta håller författarna med om, dock håller de inte med psychometrics att det är ett problem med så gamla studier publicerade för ca 40-50 år sedan. Författarna förvarar också de kriterier som används i studierna (skattning av prestation och skolbetyg).

I det förra inlägget om Wartegg skrev psychometrics

”Med tanke på det begränsade urvalet i studierna, kriteriena i studierna och att studierna är relativt gamla rekommenderar psychometrics att ifrågasätta Wartegg i urvalssammanhang. Betydligt fler studier behövs av Warteggs prediktiva validitet innan poängen på Wartegg kan användas som beslutsunderlag i urvalssammanhang. Leverantörer och uppdragsgivare av bedömningstjänster rekommenderas ta hänsyn till dessa resultat och ifrågasätta de beslut som tas med vägledning av poängen på Wartegg”

Några förtydligande kan vara på plats. För det första, kriterierna som utgörs av skolbetyg och prestationsskattning, bör ca 40-50 år senare tolkas med försiktighet. Att använda prestationsskattning som kriterie är ett bra sätt att mäta ett kriterie, dock är det frågan om skattningen är relevant för hur man idag använder Wartegg idag, tex som underlag för att välja chefer. Att använda skolbetyg som kriterie kan vara bra om urvalet handlar om att prestera i skolan, dock kan det ifrågasättas om det är arbetsprestation som ska förutsägas. Eftersom Wartegg, åtminstone i Sverige, används för urval  arbetssammanhang har en studie med skolbetyg som kriterie begränsad relevans. Slutsatsen blir att studiens ålder tillsammans med kriteriernas karaktär och det begränsade urvalet gör det tveksamt att att Wartegg ska användas i urvalssammanhang.

Om Wartegg jämförs med andra metoder som kan användas i urval ter sig resultatet än svagare. När det gäller begåvningtestning så visar den senaste meta analysen en operationell validitet på .65 för medelkomplexa arbeten (Schmidt, Schaffer & Oh, 2008; Appendix D). Urvalsstorleken är i jämförelse med Wartegg studien är enorm, bara i en meta analys som ingår i underlaget finns över 15 000 individer (Schmidt, Schaffer & Oh, 2008; Tabell 2). Även självrapporterad personlighet i form av målmedvetenhet har en stark evidens i jämförelse med Wartegg. Den senaste meta analysen visar på en operationell validitet på .22 för denna personlighetsfaktor (Schmidt, Schaffer & Oh, 2008; Appendix D), bara i en meta analys ingår 48 000 individer (Hough, 1992).
Så slutsatsen kvarstår, vilket också Jarna och Cato håller med om, evidensen är svag för att använda Wartegg för urvalsbeslut.

Referenser

Hough LM. (1992). The Big Five personality variables—construct confusion: Description
versus prediction. Human Performance, 5, 139–155.
Schmidt, F. L., Schaffer, J. A. & Oh, I. (2008). Increased accuracy for range restriction corrections: Implications for the role of personality and general mental ability in job and training performance. Personnel Psychology, 61, 827–868.
Soilevuo Grønnerød, J., & Grønnerød, C. (2011, November 7). The Wartegg Zeichen Test: A Literature Overview and a Meta-Analysis of Reliability and Validity. Psychological Assessment. Advance online publication. doi: 10.1037/a0026100

Ny forskning om rekrytering och urval

Nedan kommer en kort sammanfattning av den forskning som presenterades under ENESER-European Network of Selection Researchers konferensen i Sheffield. Wilhelmy et al. (Schweiz) presenterade en studie om Impression management. Försöker rekryterare påverka jobbsökandes intryck? Ja! Och de gör det i större utsträckning jämfört med jobbsökande. Wilhelmy och hennes kollegor visade att rekryterare använder sig av olika typer beteenden, inklusive verbala och fysiska, för att skapa ett bra intryck om organisationen och om sig själva hos jobbsökanden. När det gäller organisationen det handlar oftast om att måla upp en attraktiv bild om företaget och även om att ge en verklighetsbaserad bild. Däremot när det gäller bilden rekryterare vill förmedla om sig själva, handlar oftast om att de vill framstå som varma och inge en känsla av närhet, skapa en professionell bild men de vill också förmedla dominans och styrka (power).

En intressant studie som vi fick endast en glimt av var Stephen Woods’ (Storbritannien) undersökning om sex olika personlighetstester (bla Hogans Personality Inventory, 16PF5, OPQ) och hur de överlappar varandra i de dimensioner de mäter. Hans poäng är att bättre kunskap om de olika personlighetstesten inom organisationer kan leda till ökad förståelse för, bättre kunskap om och även en effektivare kombination av olika verktyg för att på ett effektivare sätt mäta det man är ute efter i en urvalssituation. Buijsrogge et al (Belgien) presenterade en väldigt intressant studie om effekter av jobbsökandes visuella stigma (tex synliga märken/ärr i ansikte) på rekryterarnas beteenden. Medverkande i studien fick bedöma “jobbkandidater” med och utan synbar stigma på ansiktet. Resultaten visade att försökspersonerna var mindre benägna att erbjuda ett arbete till jobbsökanden som hade något slags stigma. Detta samband påverkades (medierande effekt) av medverkarnas minne om själva intervjun med jobbkandidaterna.

Vill du veta mer om programmet och om vilka studier som presenterades hör av dig gärna till kristina.langhammer@psychology.su.se

ITC konferensen avslutad, här kommer en sammanfattning

International Test Comission, ITC, höll sin vartannat år återkommande konferens på Deltagarna, som var över 550 till antalet, representerade över 40 länder. Jämfört med tidigare ITC-konferenser så är denna den i särklass mest välbesökta. De allra flesta deltagarna var forskare eller representanter från testförlag och/eller konsultverksamheter. De två sistnämnda var även representerade i utställningen. Programmet innehöll traditionsenligt både symposier och posters. Följande är ett utdrag i korthet.

The assessment of critical thinking: Cross-cultural and validity Issues
Samtliga fyra papers presenterade resultat från studier där man använt Halpern Critical Thinking Assessment, HCTA. Resultaten visar att de med höga poäng rapporterar färre negativa “life-events” såsom att man betalat förseningsavgift på en hyrd film eller ansökt om personlig konkurs. Vidare visar resultaten att fasta svarsalternativ är bättre än öppna eftersom de senare ställer krav på personens förmåga att även verbalisera sitt logiska tänkande, något som inte ingår i konstruktet critical thinking. Man kunde även leda i bevis att skillnader i kritiskt tänkande mellan asiater och västlänningar beror på hur väl förtrogen man är med i det här fallet det engelska språket och inte på kulturella skillnader.

Testing resources help promote test develoment and use in emerging countries
Ett välbesökt seminarium som inleddes av Hazel Weldon från MHS. Hon pratade om hur MHS arbetat med att på olika sätt göra test tillgängliga på ett kostnadseffekivt sätt i olika delar av världen, att olika kulturer och länder har behov av olika lösningar och hur detta ska balanseras med skyddet av IP. Paul McKeown (Pearson Assessment) fortsatte med att prata om problem med copyright i ”emerging countries” och att tekniska lösningar kan underlätta detta arbete. Han påtalade även att utvecklingen av test i denna typ av länder är komplicerat eftersom man exempelvis i Indien har en mycket stor andel av befolkningen som är i huvudsak engelsktalande, vilka normer och hur ska de samlas in för gruppen på 220 miljoner indier som har engelska som första språk? Dragos Iliescu från Testcentral i Bukarest, Rumänien, pratade om vad som driver testanvändning i utvecklingsländer. Den låga kompetensen hos testanvändare gör det möjligt för leverantörer med mindre bra test att ta stora marknadsandelar. Detta symosium avslutades av Ilke Inceouglo från SHL som betonade bristen på lokal expertis, avsaknad av infrastruktur och ovana testtagare som potentiella utmaningar i utvecklingsländer.

Development in the Netherlands (COTAN)
Detta symposium arrangerades av COTAN och inleddes av Bas Hemker från Cito som pratade om effekten av motivation vid framför allt olika typer av ability-testing. Hans forskning visar att effekten av motivation ligger på d=.38 och d=.36 på matematik respektive läsprov. Han påtalade även vikten av forskning på effekten av motivation på low respektive high effort item. Wilco Emons bidrag gällde problematiken med att göra kortversioner av längre test. Det handlade i huvudsak om bristen på reliabilitet i förkortade skalor som en följd av de metoder man använder för att ta bort, eller välja ut, item till kortversionen men även validitetsproblemen nämndes och då i huvudsak bristen på argument om begreppsstvaliditet. Remko van den Berg från NOA i Nederländerna berättade om sin forskning gällande skillnader mellan etniska grupper i intelligens. Han kunde påvisa att skillnaderna mellan etniska minoriteter och majoriteten minskar med varje generation som en effekt av integration och den tid man sependerat i landet. Klas Sijtsma avslutade med att förkasta den klassiska testteorins antaganden och peka på flertalet sätt som framför allt reliabilitetsbegreppet har missförståtts. Han förespråkade Baysian statistics och talade om vad han vill att testförlagen ska inkludera i sina manualer nämligen IRT-baserade standard error of measurement-estimat och ”means for individual decison-making”. Vad det är i detalj framgick inte.

Network psychometrics
Detta symposium var den stora behållningen med konferensen. Dennis Borsboom, psykometriker och forskare vid universitetet i Amsterdam (och som skrivit en underbart provocerande artikeln med titeln The attack of the psychometricians för några år sedan) presenterade tillsammans med sina doktorander ett nytt sätt för att studera dynamiken i system, att analysera arkitekturen i nätverk som består av många delar och att visualisera samband som finns i sådana nätverk. Bland annat har man genom att studera depression. Den gällande, läs DSM, modellen för depression är att det finns ett latent konstrukt, depression, och att det finns flera indikatorer, symptom, på det latenta konstruktet. I modellen antas indikatorerna, eller symptomen, ha direkta linjära samband med det underliggande konstruktet, de antas inte ha några samband sinsemellan eller kunna påverka eller utlösa varandra (även om man naturligtvis är meveten om comorbiditet så har man inte kunnat hantera det i modellen).
Den modell som Borsboom föreslår är att det latenta konstruktet depression inte existerar, istället finns det att nätverk av symptom som hänger ihop på olika sätt och som påverkar varandra i olika utsträckning givet olika ”life events” och för en specifik person. Effekten av olika ”life events” antas dessutom variera mellan olika symptom. Exempelvis är det rimligt att personer med insomnia, som är ett av symptomen för depression, orsakar trötthet istället för att betrakta insomnia och trötthet som två olika oberoende symptom. Ett nätverk kan således illustrera individuella differenser för varje enskild individ men även för en grupp eller för ett antal variabler som t ex femfaktormodellen (across people, across time, across people within time). I framtiden är tanken att en nätverksanalys av en person även ska kunna ge förslag på vilken behandling som en specifik person sannolikt behöver. De visades ett nätverk gjord på FFM och det var imponerande hur tydligt man såg all den komplexitet som finns i modellen – och att Openness var som vanligt all ”over the place”. De arbetar som sagt mycket med DSM och nätverk för diagnos men detta är absolut tillämpbart för andra delar av psykologin. Deras program, som är freeware, innehåller även en välutvecklad grafisk modul som på olika sätt illustrerar nätverken och deras förhållanden. Man får alltså för första gången psykometriskt ihop både individ, variabler och situation. Mycket spännande!

The hierarchical structure of personality and performance
Dimitri van den Linden gjorde en mycket bra presentation av ”the general factor of personaliy, GFP, som faktiskt var uppe på agendan vid flertalet tillfällen under konferensen både bland posters och symposier (se tidigare inlägg om detta på Psychometrics.se). Detta forskningsområde är nu tudelat; de som anser att GFP finns och är meningsfull och de som menar att det enbart är mätfel. Van den Linden gav svar på tal, bland annat om att social desirability (SD) inte är ett problem i urvalssammanhang eftersom; (1) alla ägnar sig åt det i ungefär lika stor utsträckning så rang- ordningen mellan kandidater påverkas inte och, (2) SD bär prediktiv kraft, det innebär att behandlar man detta som felvarians så tar vi bort relevant information om kandidaterna. Alltså, alla förställer sig men ungefär lika mycket, kanske liknar det allt annat vi gör i livet!

Personality assessment across and within cultures: Adressing some methodological issues
Marise Borns redovisade forskning om effekten av hur olika referens grupper påverkar svarsresultaten. Framför allt med avseende på olika etniska minoriteter i förhållande till majoritetspopulationen. Resultaten varierade beroende på om man uppmanades jämföra sig med sin etniska minoritet eller om man uppmanades identifiera sig med majoritetspopulationen. Mycket forskning kvarstår innan några slutsatser kan dras, avslutade Maries. SHL (Dave Bartram, Ilke Inceoglu, Mathijs Affourtit) redovisade data från OPQ:s databas med över 1 miljon testningar, samtliga deras presentationer gav stöd för att OPQ fungerar på samma sätt i många länder, med opponenten Fons van de Vijver påpekade att det inte är klarlgat hur OPQs ipsativa system påverkar resultaten, många frågetecken kvarstår. Detta kunde Anne Herrmann bekräfta när hon analyserade den tyska och engelska versionen av 16PF, en betydligt mer vanlig anpassning av modeller, den som oftast framträder i självrapporterande personlighetsformulär.

ISO 10667 Test Review Systems and Test validation for 21st century tests
På ISO 10667 seminariet argumenterades att själva processen av testning kan säkerställa att det blir en valid bedömning. Eftersom det var en testkonferens så gled naturligtvis diskussionen över på validitet; Sverre Nielsen från Norge avslutade sitt anförande om ISO 10667 genom att meddela att Norge kommer att föreslå en ISO (världsstandard) för psykologisk testning. Jag (Anders Sjöberg) pratade om hur Sverige ser på certifieringsfrågan av ISO 10667 men berörde också risken att enbart fokusera på certifiering, ISO 10667 är ett dokument som kan och redan används av kommuner och föreatg för att förbättra interna processer. Marise Born beskrev hur universitetet i Rotterdam på uppdrag från offentliga myndigheter utvärderar rekryteringprocesser, där styrdokumentet är ISO 10667. Nårgra i publikeb var tveksamma till ISO 10667, men detta var mest beroende av att ISO 10667 inte funnits ute på markanden så länge. Sverige var först ut översätta standarden (ca 70 ex sålda), nederländerna var två (22 sålda ex av ISO 10667). Konferensen avslutades med en” State-of-the-Art Speech” och gavs av Stephen Sireci som är verksam vid University of Massachusetts. Han pratade om att testet i sig inte är det som ska valideras utan att användningen av testresultaten måste sättas in i ett sammanhang för att kunna valideras på ett relevant sätt. Egentligen inget nytt, även om det är kritik mot det traditionella sättet att betrakta och hantera testkvalitet på (läs EFPA och liknande kvalitetskriterier). Detta berördes också av Dragos Iliescu från Rumänien som menar att testförlag inte redovisar evidensen för tolkningen av testpoängen, vid en granskaning av 9 testmanualer kunde Dragos visade att det saknades beskrivning av vilka konsekvenser som testpoängen har för den som testas och organisationen som beställer testninge, själva ”huvudpoängen” med testning!

Det framkom också på konferensen att även om det finns en modell för hur test ska granskas i Europa så finns det inte något land som gör likadant. Det har inte heller varit meningen, säger Dave Bartram från SHL, EFPA review model ska ses som guidelines och inte som en standard. Som exempel kan nämnas att UK sätter olika många stjärnor för varje test, Norge har ett system där man godkänner eller underkänner test, Sverige har ett system där man både betygsättar och beskriver testets kvalitet, medan US har en modell som närmast kan beskrivas som ett samarbete mellan förlag och granskare där slutprodukten beskriver testet fördelar och nackdelar beskrivs, förlagen (utvecklarna) kan använda detta som ett underlag för att vidareuteveckla testet. US systemet är det klar äldsta systemet, har funnits sedan 50-talet och intressant att det är endast Ryssland som numera har samma system. Värt att notera är att det är endast i Norge och Sverige som man tar betalt av förlagen (50 000 kronor i Sverige och 100 000 kronor i Norge), i resterande länder så är det gratis för förlagen. I Nederländerna bestämmer granskarna själva om de ska granska ett test (närmare att betrakta som konsumentupplysningen i Sverige). Hur Sveriges system ska se ut kommer att beslutas om i höst av STP och Psykologernas fackförbund, tyck gärna till ni som är i branschen?

Till sist ska alla frivilliga ha en stor eloge om gjorde att denna ITC konferens blev riktigt lyckad, särskilt Marise Born och Arne Evers som jobbat dygnet runt för att få ihop ett strålande program, världsklass.

Anders Sjöberg

Networks Psychometrics

Forskare från Nederländerna har tagit fram en ny modell för att psykometriskt analysera testdata.

Analysen kan visualera hur komplexa resultat kan förstås utifrån ett kausalt system. Denny Borsboom, som leder forskningen, berättade om det nya systemet och vilka konsekvenser de kommer att bli för diagsnostiseringen av psykopatologi. I framtiden kommer psykologen/psykiatrikern ha ett databaserat program som kommer föreslå diagnos och behandling som tar hänsyn till tidigare forskning och personens unika situation.

Angélique O.J. Cramer har analyserat data hur detta system ger en ny bild av forskningen om depression som kan  förklara hur den unika individen samvarierar med gruppen. Sacha Epskapmp visade oss hur networks psychometrics kan visualiseras, och Verena D. Schmittmann hade anlalyserat hur samtliga diagnoser i DSM IV kan sammanfattas i en ”giant component”. Bilden ovan visar hur komplext NEO PI är som mäter Big Five modellen av personlighet. Bilden visar att B5 inte är oberoende av varandra och att det är Neuroticism är den övergripande faktorn i personlighet. Bilden visar hur alla 240 item är relaterade av varandra, analysen öppnar upp möjliheter för både den tillämpade forskningen om personlighet och hur testresultat avseende alla typer av test kan analyseras i framtiden.

Psychometrics på testkonferens. Idag startar en av världens största konferenser avseende psykologiska test

The 8th Conference of the International Test Commission will take place in Amsterdam, The Netherlands. 3-5 July 2012. The conference will be held at the Royal Tropical Institute (Koninklijk Instituut van de Tropen) in Amsterdam.

What is the International Test Commission?
The International Test Commission (ITC) is an “Association of national psychological associations, test commissions, publishers and other organizations committed to promoting effective testing and assessment policies and to the proper development, evaluation and uses of educational and psychological instruments.” (ITC Directory, 2001). The International Test Commission (ITC) facilitates the exchange of information among members and stimulates their cooperation on problems related to the construction, distribution, and use of psychological tests and other psychodiagnostic tools. To achieve these goals the ITC organizes international meetings and discussions, promotes the publication of relevant information by means of its own and other scientific outlets, and stimulates international cooperation on research projects relevant to a scientifically and ethically sound use of tests.

More information
For more information about the conference, www.conference.intestcom.org

Jag kommer rapportera om det dyker upp något intressant.

Anders Sjöberg

30.000 kronor för en chefsrekrytering!? Det stämmer?

Toni Ahlström, som ingår i den svenka ISO gruppen, anser att han kan ge dig en träffsäker, rättvis och beprövad rekrytering för 30 000 kronor.

Att det är  möjligt att kapa kostnader för rekryteringar bör alla vara intresserade av, men är det då möjligt att bibehålla (eller kanske öka) träffsäkerheten. Jag vet att det är möjligt, det går att standardisera och på det viset både kapa kostnader och öka träffsäkerheten. Det viktiga, som Toni påpekar, är att rekryteraren inte ”besitter en magisk låda, en speciell fingertoppskänsla eller en utvecklad intuition”, bara att rationalisera bort detta ökar validiteten i bedömningen, samt minskar kostnaden. Så betala inte för flummiga kompetensmodeller och en massa ord, fråga istället rekryteraren hur stor sannolikhet är det kandidaten kommer att lycka på jobbet. Om inte rekryteraren kan svara på detta, byt leverantör.

30 000 kronor för detta. TAGET.

Ring Toni 0704 174 000

Anders Sjöberg

Urvalsgruppen i Sheffield. Kristina Langhammer rapporterar om forskningsresultat

Just nu befinner jag mig i Sheffield, Storbritannien, på ENESER konferens (European Network of Selection Researchers). Min presentation av våra resultat i ovan nämnda studie har väckt väldigt positiv respons. Några av våra europeiska kollegor har visat intresse av att fortsätta forska inom området och även att samarbeta med oss.

Huvudpoängen dock är att den här forskningen är väldigt aktuell och väcker intresse.

Jag har också hunnit reflektera lite på våra resultat och mina slutsatser är följande:
– vi vet att rekryterare som har en intuitiv beslutsfattande stil kommer också att välja en helhetsbedömning dvs. holistisk urvalsförfarande. Däremot är frågan, vad är det som gör att rekryterare med en mer rationell orienterad stil väljer fortfarande helhetsbedömningen. Kan det vara så att man missbedömer urvalssituationens vikt?

– vi kunde inte påvisa kontextens betydelse för valet av urvalsstrategi. Detta betyder inte att den effekten inte finns. Vi behöver helt enkelt hjälp av praktiker, både rekryterare och anställande chefer, för att studera den effekten. Det jag vill säga är att vi behöver mer data.

– vi behöver också jobba med att öka förståelsen hos rekryterare och anställande chefer för vad mekanisk datainsamling och sammanvägning innebär. Då kanske försvinner rädslan för det okända och minskar risken för att vända sig gång på gång till något som är så opålitlig samtidigt så tryggt och varm som den egna magkänslan.

Återkommer under veckan med en kort sammanfattning om forskning som presenterades på konferensen dvs. senaste forskning inom området i övriga Europa.

Kristina

Hur fattas urvalsbeslut? Resultat från Urvalsgruppen

Urvalsgruppen har skrivit en forskningsrapport där resultatet ska redovisas på konferensen European Network of Selection Researchers (ENESER) i sommar. Författare är Kristina Langhammer, Anders Sjöberg, Sofia Sjöberg och Thomas Lindevall, alla från psykologiska institutionen Stockholms universitet. Psychometrics beskriver nedan först huvudresultatet av studien, och sedan mina egna kommentarer av resultatet i förhållande till rekryteringsbranschen.

Som Psychometrics tidigare behandlat kan informationen vid personbedömning vid rekrytering vägas ihop på två olika sätt. Det första tillvägagångssättet är så kallad intuitiv tolkning, vägningen av informationen insamlad om kandidaten avgörs av rekryterarens subjektiva tolkning.

Det andra sättet att tolka samma information är mekanisk tolkning. Denna tolkningsmetod bygger på att det finns en i förväg utvecklad evidensbaserad tolkning av informationen som anger sannolikheten att en viss individ ska prestera bättre på arbetet än andra.  Istället för att rekryteraren använder sin subjektiva tolkning grundas tolkningen på en väl beforskad vägning av olika informationskällor (intervju, testpoäng och CV). Det har sedan 50-talet varit känt att den mekaniska tolkningen är överlägsen den intuitiva tolkningen

För att få ett mått på hur väl utbredd den subjektiva helhetsbedömningen är har urvalsgruppen via linkedIn, facebook och psychometrics.se tillfrågat 168 personer hur de genomför en personbedömning.  Personerna fick inte bara ta ställning till om de skulle välja den intuitiva eller mekaniska metoden för att väga ihop informationen utan också om de skulle välja en standardiserad eller ostandardiserad insamlingsmetod av den information som ska vägas ihop. Av de fyra alternativ personerna kunde välja fördelade sig svaren på följande sätt.

Ostandardiserad insamlingsmetod och intuitiv bedömning 29%.

Ostandardiserad insamlingsmetod och mekanisk bedömning 1%.

Standardiserad insamlingsmetod och intuitiv bedömning 56%.

Standardiserad insamlingsmetod och mekanisk bedömning 14%.

Så stor andel säger som 29% säger att de skulle arbeta helt ostrukturerat med rekryteringsprocessen och bedömningen. Men det vanligaste sättet (56%)är att personerna arbetar standardiserat med datainsamlingen, men när det väl kommer till urvalsbeslut är det helhetsbedömningen som gäller, ofta kallad magkänslan.

Vad är det då som påverkar detta val? För att ta reda på detta utsattes deltagarna för olika scenarios av ansvarskyldighet. Resultatet visade att detta inte spelade någon roll, oavsett om rekryteraren var helt ansvarig för både urvalsprocessen och beslutet väljer de flesta den intutiva bedömningen och den standardiserade insamlingsmetoden. Den faktor som hade en liten påverkan på hur man väljer var allmän beslutsstil, de personer som generellt har en preferens att gå på magkänsla väljer det också i rekryteringsprocessen, inte så förvånande. Förvånande resultat var dock att de som hade en preferans för rationell beslutsstil inte valde en mekanisk tolkningsmodell.

Så slutsatsen av studien är; oavsett situation väljer de flesta att vara standardiserade när information ska samlas in om kandidaterna, men när det kommer till beslut då används den berömda helhetsbedömningen.

Mina egna slutsatser (Anders Sjöberg)

Varför är det så? Ja, en av anledningarna är det som lärs ut på universitet, högskolor och på andra utbildningar. Nedan kommer en text från en bok (Lindelöw, 2008) som flitigt används av utbildare och rekyterare.

”Man kan tänka sig att olika kriterier tilldelas numerisk vikt. Slutkandidaternas skattning multipliceras då med en numerisk vikt, och den totala summan sammanfattar både de sökandes skattning och kriteriernas relativa vikt” (sid 186)

En väldig bra beskrivning på en mekanisk tolkning av data. Men på nästa sida (187) kan man läsa följande;

”Personligen tycker jag inte att detta resonemang tillför särskilt mycket eftersom jag inte tror på matematiska beslutsmodeller inom detta området. Skälet till detta är att vi ändå måste fatta det slutliga beslutet baserat på en helhetsbild av de sökande, och att det finns en dålig precision i mätningarna för att förlita sig helt på siffrorna”

Alltså, efter nästan 60 års forskning, en psykolog som fått nobelpriset (Kahneman) för att han visat att den mekaniska tolkningen är överlägsen den subjektiva bedömningen, alltfler ekonomer och läkare som överger den subjektiva modellen vid beslutsfattande, verkar rekryteringsbranschen stått helt stilla. Urvalsgruppen kommer fortsätta att titta på hur detta påverkar organisationers produktivitet och vilka som diskrimineras pga av att magkänslan avgör vem som får jobbet. Vad tycker du? ska vi fortsätta i samma anda eller är det dags att ändra på rekryteringsbranschen?

Referens

Langhammer, K, Sjöberg, A., Sjöberg, S & Lindevall, T. (2012). Decison-making style, accountability and responsibility: Influences on preferred hiring approach. Paper prepared for presentation, ENESER 2012.

Lindelöw, M. (2008). Kompetensbaserad personalstrategi. Stockholm: Natur & Kultur.

Myter och sanningar om psykologiska test?

Personlighet & Intelligens

Personlighet. Ett vanligt inslag inom personbedömning är att administrera ett personlighetstest. Detta test sägs kunna matcha rätt person till rätt jobb. Andra användningssätt är att tolka anställdas resultat för att användas vid utvecklings insatser. Men fungerar detta i praktiken? Frågor som vilka egenskaper som ska testas och om det går att lura ett personlighetstest besvaras. Denna föreläsning tar upp myter och sanningar om personlighetstestning. En kort historik om mätning av personlighet och praktiska exempel illustrerar hur ni maximerar Er personlighetstestning oavsett vilken leverantör ni har idag.

Intelligens. Intelligenstestning har en lång historik men är betydligt mindre frekvent använt bland rekryterare och HR personal i jämförelse med personlighetstestning. En anledning till detta är att det fortfarande är ett laddat ämne att ta upp. Denna föreläsning tar sitt avstamp i historien kring intelligenstestning och beskriver hur testningen såg ut då, hur den ser ut idag och hur den kommer att se ut i framtiden. Även om mätning av intelligens blivit mer populär inom arbetslivet de sista åren så använder organisationer testresultatet sällan i praktiken. Anledningen till detta beskrivs utifrån psykologiska teorier om begränsningar i vår beslutsförmåga.

För mer information klicka på nedan länk

Psykologisk testning

Avancerad dataanalys. Beskrivning av två nya utbildningar.

Under våren har Psychometrics genomfört konsultation inom avancerad data mining, både inom näringslivet och det akademiska. Nu kan ni som är intresserad av avancerad dataanalys för att förutsäga kommande beteenden och händelser beställa kurser från Psychometrics. För att analysera stora datamängder kommer programvarorna JMP (IRT) och AMOS (SEM) demonstreras under utbildningsdagarna. Beroende av förkunskap skräddarsys utbildningarna efter behov.

 

Item Response Theory (IRT)

Inom flertalet forskningsområden som psykologi, pedagogik och medicin är det viktig att ha reliabla och valida skalor när olika frågeställningar ska belysas. Dessa item kan ingå i formulär som mäter personlighet, begåvning attityder, intentioner och/eller kartlägger beteenden. Ett problem som uppstår vid utveckling av dessa skalor är att det är svårt att välja ut vilka item som ska ingå i den slutgiltiga skalan. Den traditionella psykometriska modellen klassisk testteori har sin begränsningar som delvis kan övervinnas med item-resopnse theory (IRT).  Klassisk test-teori är beroende av det urval som du undersöker skalans egenskaper på medan IRT är oberoende av urvalet. En annan fördel med IRT är att samma skala används för både personer och item, på detta sätt kan mycket vinnas pedagogiskt när svarsmönster ska rapporteras.

Fullständig kursbeskrivning

IRT kurs Psychometrics

Struktur Ekvations Modeller (SEM)

Inom flertalet studier är sk icke-observerbara variabler av betydelse. Dessa latenta variabler kan vara personlighet, begåvning attityder, intentioner och beteenden. Ett problem som uppstår vid mätning av latenta variabler är att de poäng som utgör basen för sambandsberäkningen är behäftade med mätfel. Mätfel kan uppkomma av en mängd olika orsaker. Vid personlighetsmätning kan tex social önskvärdhet vara upphovet till mätfel, dvs personerna vill framställa sig i bra dager inför intervjuaren. Ett annat exempel på mätfel kan vara mer slumpmässigt, tex att just den dagen personen besvarar en enkät har något hänt som påverkar personens svarsmönster. Både typer av mätfel går att beräkna och korrigera för, med Struktur-Ekvations-Modellering (SEM).

Fullständig kursbeskrivning

SEM kurs Psychometrics