SIOP Dag 2

BIG DATAIdag har jag fokuserat på BIG DATA och vad som är nytt på detta område. Big data utgörs av digitalt lagrad information av sådan storlek att det är svårt att bearbeta den med traditionella statistiska metoder som används av psykologer. Big data innefattar tekniker för very large databases (VLDB), datalager (data warehouse) och informationsutvinning (data mining).

Termen big data fick sitt genomslag under början av 2000-talet. Dessa stora datamängder skapas inom en mängd olika områden som meteorologi, bioinformatik, genomik, fysik och naturligtvis även inom området bedömningsmetoder inom urval.

Big data för mig fram tills nu har varit att det är stora datamängder, men att det är samma statistiska analyser som genomförs i form av olika korrelationsstudier. En annan del, som jag förstått, är också att data kan samlas in i realtid, för varje person som gör ett test kan normer uppdateras. Efter dagens seminarier och en utbildningseftermiddag kan jag konstatera att det hänt en del utanför psykologin som kan vara användbart inom bedömning och urval.

Framförallt har nya varianter på analyser utvecklats för att förutsäga beteenden i organisationer. Dessa statistiska metoder används idag för att analysera data där det inte finns några svar från början. Skillnaden mellan den psykologiska forskningen och detta angreppssätt är att vi inom urvalspsykologin för det första vet hyfsat vad vi mäter och att vi oftast inte har så många variabler i samma analys som vi är intresserade av. Inom många andra områden har man ingen aning av vad som predicerar vad, och det är där de nya metoderna först och främst kommit till användning.

Under de senaste åren har jag utvecklat algoritmer för att väga ihop data om kandidater (från test, assessment center och intervjuer) genom att förlita mig på traditionella analyser såsom tex regressionsanalys, och logistisk regression. Inom big data har dessa regressioner utvecklats och generaliserats för att inte övertolka vissa samband.

När man gör en lokal vailideringstudie (en studie där man har data på bedöming och minst ett kriterie) finns det risk för att en sammanvägning av data den traditionella analysen visar övertolkar sambanden, eller väljer fel variabler som prediktorer. De nya analyserna som professorerna Oswald och Putka redovisade med hjälp av programmerinsspråket R (som är ett helt gratis statisk program, kan man säga) råder delvis bot mot denna svaghet.

Det finns egentligen två saker som avgör om en kombination av variabler, tex personlighet och intelligens, kan förutsäga relevanta beteenden i organistioner; korrelationen med kriteriet och korrelationen mellan prediktorerna (i detta fall Big Five och intelligens). De traditionella metoderna har svårt att på ”rätt sätt” ta hand om sambanden mellan variablerna när algoritmer ska byggas, vilket på ett pedagiskt sätt professorna visade hur detta tas om hand av dessa nya analyser.

Efter tre timmars föreläsning var jag helt slut, men kunde konstatera att detta var den stora behållningen hitintills på SIOP. Hann också med att köpa en bok om beslutsfattande i organisationer som Scott Highhouse har varit redaktör för som ser väldans intressant ut. Träffade även Scott i en paus för en snabb diskussion om den nya boken och kommande marknadsföring av denna. Ska läsa den och återkomer med en rapport (Scott var på SU och var opponent på Kristina Langhammers avhandling för två år sedan). Avslutade dagen med en utmärkt middag på Mortons Steakhouse med några amerikanska kollegor från Hogan Assessment, nya friska tag imorgon.

 

 

Publicerat av Anders Sjöberg

Anders Sjöberg är docent i psykologi och har lång erfarenhet av bedömningsmetoder in arbetslivet. Anders har utvecklat psykologiska bedömningssystem som används av både privata och offentliga organisationer. Anders har publicerat böcker och vetenskapliga artiklar inom organisationspsykologi och psykologisk metodutveckling.

Lämna en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *

Denna webbplats använder Akismet för att minska skräppost. Lär dig hur din kommentardata bearbetas.