Datorn bättre än människor att bedöma personlighet påstår forskare. Nej, det är fortfarande människor som gör bedömningen

För några år sedan träffade jag en ambitiös person vid namn Michal Kosinski på någon av de konferenser som jag var på, mycket övertygande berättande han om den nya psykometrin som skulle upplysa många beslutsfattare, inte minst när det handlar om urval. Jag var då skeptisk till det han sa. Sedan fick jag vatten på min kvarn när han tunerade runt (med stort stöd från Cambridge psychometric centre) och påstod att han kunde mäta personlighet genom sociala medier på ett tillförlitligt sätt. Det jag vände mig emot var att det fanns svagt empiriskt stöd för hans påstående. Det jag sa då får jag äta upp nu, nyligen publicerade Kosinski med kolleger en mycket imponerande undersökning som tydligt visar att det är möjligt att fånga delar av personligheten med hjälp av att kartlägga ”Likes” på facebook. De benämner sin artikel ”Computer-based personality judgments are more accurate than those made by humans” (Youyou, Kosinski, Stillwell, 2015).

Forskarna samlade in över 70 000 personers ”Likes” på facebook, samma personer fick fylla i ett personlighetstest (kvar blev ungefär 17 000 personer). På detta sätt kunde antal Likes kopplas ihop med personernas personlighetsdrag (Big Five). Förutom detta fick deras vänner, familj och bekanta också bedöma personligheten hos de som hade gjort ”Likes”. Forskarna kallar bedömningen för Likes för ”computers’ judgement” eftersom dessa Likes samlas in och analyseras med algoritmer. De kallar den egna bedömningen för ”Self-ratings” och andras bedömning av personligheten för ”Humans’ judgements”. I artikeln utgör ”Self ratings” den ”riktiga” personligheten. På detta sätt kan man jämföra vilket sätt som är bäst på att undersöka den rätta personligheten (self ratings), är det datorn (Computers’ judgement) eller människan (Humans’ judgement)? Se figur nedan.

Här kommer en sammanfattning vad forskarna kom fram till

I medel behöver datorn 100 Likes för att prestera bättre än andras ”ratings” av personligheten

Och mer specifikt behöver…

datorn 10 Likes för att vara bättre i jämförelse med en arbetskollega som bedömer personligheten
datorn 70 Likes för att vara bättre i jämförelse med nära vän eller rumskamrat som bedömer personligheten
datorn 150 Likes för att vara bättre i jämförelse med en familjemedlem som bedömer personligheten
datorn behöver 300 Likes för att vara bättre i jämförelse med en make/maka/sambo som bedömer personligheten

När det gäller vilka Likes som kan kopplas till vilka personlighetsdrag ger forskarna exempel på att de som har högt i öppenhet gillar Salvador Dali och Ted talks, och de personer som är extraverta gillar party, reality serier och dans. Öppenhet var lättast att bedöma med. Besvärligast att kartlägga med facebook Likes var emotionell stabilitet och målmedvetenhet (intressant att dessa är de som båda förutsäger arbetsprestation).

Sedan undersökte forskarna hur dessa tre olika bedömningar av personlighet samvarierade med en rad externa mått såsom depression, hälsa, drogmissbruk, livstillfredställelse etc etc. Där vann inte helt oväntat den egna skattningen över både andras skattning och datorn (mycket pga av det är samma person som bedömer både personlighet och externa mått). Men i fyra av tolv fall vann faktiskt datorn över den egna skattningen; facebook aktiviteter, drogmissbruk och hur mycket man surfar på nätet. Personligheten kartlagt med datorn vann i 12 fall av 13 fall över andras skattning (human judgements), som är forskarnas USP (Unique Selling Point)

Konklusion (enligt forskarna): ”Computer-based personality judgments are more accurate than those made by humans”

Först vill jag säga att detta är mycket bra forskning publicerad i en ansedd tidskrift, all heder åt Kosinski & Co. Det ska också sägas att en hel del material är nog borttaget från publikationen av utrymmesskäl (så det finns mer att krama ur detta enorma big data material). Men, det verkar inte som forskarna kan den psykologiska historian om mekanisk kontra klinisk tolkning av data, så här tänker jag.

Det forskarna kallar ”computer judgement” kallar jag ”data combination of Likes” eftersom det är fortfarande människor som står för bedömningen, i detta fall trycker personerna på Likes knappen på Facebook, sedan svarar samma människor på ett personlighetsformulär. Detta är samma källa data kommer ifrån när man trycker på Likes och när man svarar på personlighetsitem (self ratings), i mina ögon är det testformatet som förändras. I ”computer judgement” är det Likes som utgörs av item (information), i det andra fallet (self ratings) är det personlighetstestet som innehåller en typ av item som ska mäta personlighet, och i det tredje fallet är det någon annan (frugan, brorsan, syrran, polarn på jobbet, chefen etc etc) som svarar på samma personlighetsitem. Så min konklusion är, att samla data från Facebook kan liknas vid vilket test som helst, och att samla data från personen är ett test och samla data från andras perspektiv är ett test. Alla dessa test räknas ihop av en dator, men källan varifrån data kommer ifrån skiljer sig åt.

Detta resultat kan också analyseras utifrån den klassiska testteorin (psykometrin), givet allt annat lika ju fler observationer du har desto säkrare blir dina bedömningar (om data kombineras statistiskt). Detta syns också i resultatet, det krävs olika antal Likes beroende på vem som ger informationen. Så nej det är inte datorerna som gör bedömningen det är människor som fortfarande gör bedömningen, skillnaden är hur du kombinerar data från olika källor maximalt för ditt syfte med bedömningen. Om du har rätt redskap i din psykometrilåda kan du nå långt med att samla data på sociala medier. Om du har ett bra test kan du be personerna svara på dessa frågor (det Hogan kallar identity), och du kan ställa dessa frågor till andra personer (reputation).

Vi är mogna att säga att datorn gör bedömningen, för detta krävs artificiell intelligens, och dit har vi inte nått, ännu. Så ta det lugnt om du är i personbedömarbranschen, din bedömningskunskap behövs fortfarande inte minst för att avgöra vilken data som ska analysera. Men som tidigare påpekats, låt datorn kombinera dina bedömningar. Om du ska till SIOP i Philadelphia rekommenderar jag att du bokar denna session, där kommer dessa frågor dryftas.

Ladda ned artikeln här

Delta i diskussionen

2 kommentarer

Per Carlbring säger:

18 januari, 2015 kl. 05:37

Tack för bra läsning! Fast jag vågar inte "gilla"… 😉

Man kan tycka att det var lite orättvist att datorn fick en massa likes att analysera, medan ens vänner endast skulle beskriva personligheten utifrån 10 stycken kryssfrågor. Sedan ska man komma ihåg att även om datorn får obegränsat med likes så var korrelationen långt ifrån perfekt (utan r=.66).

Även jag har skrivit lite om denna studie (och några andra Facebook artiklar) här: http://www.carlbring.se/psykologisk-forskning-om-…

Svara
anderssjberg säger:

18 januari, 2015 kl. 08:02

Ha ha jag gillade precis ditt inlägg. Ja det här visade Spearman i den klassiska testteorin för 100 år sedan, så lite förvånansvärt är ändock publikationen utan metodologiska kommentarer, ingen hänvisning till Paul Meehl och/eller Kahneman om människans förmåga att bedöma andra personer, utan full fart på "computer judgement". Har publicerat tillsammans med några matematiker avseende artificiell intelligens (datorn får lösa intelligens items), och de har något på gång men det är en lång bit kvar innan man kan säga att datorn bedömer något eller själv gör något.

Svara

Lämna en kommentar

Avbryt svar

Denna webbplats använder Akismet för att minska skräppost. Lär dig hur din kommentardata bearbetas.

Publicerat av Anders Sjöberg

Delta i diskussionen

Lämna en kommentar

Avbryt svar