Läsarfråga: Skapa index

Q: I ett enkätmaterial som handlar om miljö har jag funnit en fråga om transportbeteende som är min beroende variabel. Problemet är bara att den är uppdelad i fem kategorier av samma fråga och sedan har varje kategori sex svarsalternativ. Jag skulle behöva skapa ett index av dessa fem för att kunna få en variabel som jag kan kalla ”transportbeteende”. Just nu har jag fem beroende variabler känns det som. Är det en bra idé att skapa ett index? Hur går jag tillväga?

A: Det låter som en bra idé tycker jag. Om det är samma struktur på svarsalternativen på de fem frågorna är det dessutom extra enkelt.

Det första du kan göra är att testa hur bra ett eventuellt index skulle bli – mäter variablerna samma sak? För att det ska bli ett bra index vill vi gärna att personer som svarat högt på en fråga ska ha svarat högt på en annan fråga. På så sätt kan vi säga att indexet mäter ett underliggande koncept, till exempel ”miljömedvetenhet”, eller ”transportbeteende”.

1. Först kodar du bort alla missing-värden från variablerna.

2. Därefter går du in på Analyze –> Scale –> Reliability analysis. I rutan klickar du i alla variabler du vill ska ingå i indexet. Sedan klickar du på knappen ”Statistics”. I rutan ”Descriptives for” klickar du i rutan ”Scale if item deleted”. Därefter klickar du på ”Continue” och ”Ok”.

Du får nu ut tre tabeller. Den mest intressanta är den som heter ”Reliability statistics”. Där står Cronbach’s Alpha angivet, som är ett mått på hur bra variablerna i skalan hänger ihop, och går mellan 0 och 1. Ju högre desto bättre. Gränsvärdet är 0,7. Får din skala över 0,7 är det en bra skala, annars inte.

3. Sedan kollar du på nästa tabell, ”Item-total statistics”. För varje variabel i skalan kan du nu se i kolumnen ”Cronbach’s alpha if item deleted”. Det visar helt enkelt vad Cronbach’s alpha blir om du tar bort den variabeln. Så om du nu har fått ett värde under 0,7 för hela skalan kan du se om Cronbach’s alpha skulle öka till över 0,7 om du tog bort ett särskilt item. Om det är så kan du fundera på om det är teoretiskt motiverat. Är det så att variabeln sticker ut något i förhållande till de andra? Man kan kanske också ha den som en egen beroende variabel.

4. När du har kommit fram till vilka variabler som ska ingå i indexet går du in på ”Transform –> Compute variable”. I rutan ”Target variable” skriver du in namnet på ditt index. I rutan ”Numeric expression” klickar du in alla variabler som ska ingå i indexet, med plustecken emellan, så att det ser ut såhär:

variabel1 + variabel2 + variabel3 + variabel4

Ditt index är ett additivt index, alltså, alla ingående variabler adderas ihop. Om variablernas värden gick mellan 1 och 6 går indexet nu mellan 4 och 24. Om du vill att det ska vara enklare att tolka kan du i rutan skriva in ytterligare matematiska operationer för att modifiera indexet, typ:

((variabel1 + variabel2 + variabel3 + variabel4)-4)/20

En parentes innebär att uträkningen sker först. Uttrycket ovan innebär att först adderas variablerna ihop, så att vi har ett index som går mellan 4 och 24. Därefter tar vi minus 4, så att indexet nu går mellan 0 och 20. Därefter delar vi indexet med 20, så att det nu går mellan 0 och 1.

5. För att kolla att det blev rätt bör du ta ut deskriptiv statistik på indexet, så att du ser att min och maxpunkter har blivit rätt.

OBS! Om variablerna i indexet har olika många värden kommer de att väga olika mycket i indexet – om till exempel tre variabler går mellan 0 och 5 och en variabel går mellan 0 och 100 kommer det att för indexet betyda mycket mer vad man har för värde på variabeln som går mellan 0 och 100, vilket man oftast inte vill.

 

Uppdatering: Det finns nu en guide till hur man skapar index och undersöker reliabiliteten i dem.

20 thoughts on “Läsarfråga: Skapa index

  1. Hej!

    Är nybörjare på Spss. Jag har skapat flera olika index men kan ej hitta eller minnas frågorna de består av. Det skall tydligen vara ett enkelt sätt att se vilka frågor mina index består av…

    Tack på förhand, Dimitris

    • Hej Dimitris!
      Om du inte har dokumenterat det någonstans så vet jag tyvärr inget sätt att ta reda på det. Du kan ju prova att leta efter korrelationer mellan ditt index och de frågor du misstänker ingår i indexet – alla ingående frågor är rimligtvis korrelerade med indexet, men det är ju ingen säker metod. Det enklaste tror jag är att du helt enkelt gör om de index du behöver och i en Label till variabeln skriver ner vilka frågor som ingår. Dessvärre!

      /Anders

      • Man kan alltid öppna logen (förutsatt att man har rätt iställningar i SPSS) för att se vad man har gjort tidigare. I loggen sparas alla exekverade kommandon.

    • Hej Maja!
      Det är ett värde som brukar användas, jag vet faktiskt inte hur man har räknat fram att just 0.7 är tillförlitligt. Jag googlade det och hittade en referens till

      Nunnaly, J. (1978). Psychometric theory. New York: McGraw-Hill.

      I den boken förklarar han antagligen varför just 0,7 är ett bra värde. Det händer dock att folk kör med skalor som ligger något under 0,7 om de är vettiga teoretiskt.

  2. Hej!

    Du skrev att då variablerna adderas ihop får vi ett index som går mellan 6 och 24. Borde inte indexet gå mellan 4 och 24? de som svarat motsvarande det lägsta variabelvärdet (alltså 1) på alla fyra frågorna borde ju hamna på det sammanlagda variabelvärdet 4. Eller har jag fel?

    Mvh Martin

    • Hej Martin!
      Du har helt rätt. Jag förstår inte vad jag tänkte på. Måste ha blivit förvirrad av att maxvärdet på varje enskild variabel var 6. Det ska nu vara åtgärdat. Tack så mycket för att du påpekade felet!

      /Anders

      • Jag e också spss nybörjare och har gjort en enkät som nu ställer till ett smärre helvete för mig. Tänkte också göra ett index. Men eftresom övriga enkätfrågor baseras på ordinalskala 1-6 undrar jag om det är möjligt att få indexet att gå från 1-6 så att det blir mer lättförstått. Hur kan jag annars jämföra en median på en viss fråga med den siffran jag får i indexet.

        Krångligt detta. Hade typ trott att man kunde bara dela alla svarsresultat som ska ingå i indexet med antal frågor i indexet och alltså inte behöva skapa ett index utan kalla variabeln för typ fråga BCD och avrunda till närmsta jämna siffra.

        Börjar fatta nu att det nog är en spsskatastrof att göra så.

      • Hej Jessica!
        Det går att göra så att indexet går mellan 1-6.

        1. Först kontrollerar du att alla frågor som ska ingå i indexet går mellan samma siffror, typ 1-4 eller 1-7 eller vad som helst – det viktiga är att inte vissa frågor går mellan 1-4 och andra mellan 1-28.

        2. Därefter går du in på transform–>compute och gör en ny variabel, ”tempindex” som helt enkelt är alla indexfrågorna ihopplussade, som jag beskriver i inlägget här ovan.

        3. Sen räknar du ut vad det teoretiska min- och maxvärdet på ditt nya index är. Om det till exempel var 6 frågor som du adderade ihop, och de alla gick mellan 1-4, så är det minsta någon person kan ha på indexet 6, och det maximala 24 (sex ettor respektive sex fyror). Du har nu ett index som går mellan 6 och 24.

        4. Gå nu in på transform–>compute och gör en ny variabel. Du skriver in att variabeln ska vara

        ((tempindex-6)/18)*5+1

        Vad betyder det? Jo, det betyder att först ska vi subtrahera 6 från ”tempindex”, som förut gick mellan 6 och 24. När vi drar ifrån 6 kommer variabeln gå mellan 0 och 18. Därefter delar vi indexet med 18 så att det nu går mellan 0 och 1.

        Därefter multiplicerar vi indexet med 5, så att det går mellan 0 och 5. Sen adderar vi 1, så att det går mellan 1-6.

        Lite lurigt, men det viktiga är alltså att först få indexet att gå mellan 0 och 1, och sedan multiplicera med 5 och addera 1.

        Lycka till!
        /Anders

  3. Hej Anders! Jag undrar om man kan använda dikotoma-variabler i ett index? Gör man i så fall om de till dummy-variabler och sen adderar ihop dem? Med tre variabler får man i så fall en skala från 0 till 3. Vilken typ av variabel har man då skapat och hur kan man hantera den i SPSS?

  4. Om man vill skapa ett index över medelbetyg bland ett antal skolämnen och välja bort det med störst bortfall, hur gör man då? vad ska man titta efter? beskriv gära steg för steg för är ganska dåligt på detta

    • Hej Sara!
      För att göra indexet går du in på ”Transform->Compute variable” och klickar in de olika variablerna för betyg i de olika ämnena i rutan ”Numeric expression” och skriver plustecken emellan. Därefter sätter du paranteser runt hela uttrycket och delar med antalet ämnen. Såhär:

      (ämne1 + ämne2 + ämne3 + ämne4)/4

      Då adderas betygen i de olika ämnena ihop och sedan divideras med antalet ämnen för att få fram snittet.

      Om du vill ta bort det ämne där det är störst bortfall gör du lämpligen så att du går in på ”Analyze->Descriptive statistics->Descriptives” och klickar i alla de olika ämnena. Då ser du hur många giltiga svar det finns för varje ämne, och så utelämnar du det med minst antal.

      /Anders

  5. Apopå att skapa index, låt säga att vi har 11 variabler med underliggande koncept ”miljövänlighet”.
    Samtliga 11 variabler har svarsalternativ 0-10 med missing value 96, 98, 99 (de som inte svarat, helt eller delvis,eller där frågan inte ställdes öht).

    När jag skapar index lägger jag ihop samtliga 11 variabler och dividerar med 11 och räknar ej med 96, 98, 99.
    Jag får då ett index mellan 0-10.

    Om jag förstått saken rätt så ska indexet ENDAST ta med de personer som svarat på samtliga 11 frågor.

    Jag har tagit en descriptive analys på samtliga 11 variabler var för sig, där antalet giltiga svar (när jag rensat bort 96, 98 & 99) är som mest 1693 stycken giltiga svar i variabel 1, och som lägst 1664 svar i variabel 3 (övriga variabler ligger därimellan).

    Nar jag compute-ar index på variablerna får jag N 1564, d.v.s. 1564 personer har svarat på samtliga 11frågor vilket för mig låter helt rimligt.

    Det problem jag brottas med är att i facit på den litteratur jag använder, påstår att index N = 1693 vilket borde vara helt uteslutet.
    Ville bara försäkra mig om att jag tänker i rätt banor och att jag möjligtvis stött på ett tryckfel…

    • Hej, ja det stämmer att bara de personer som svarat på samtliga frågor ska komma med i indexet. Så det låter rimligt att det slutliga n blir 1564. Om de får 1693 i facit så kanske de glömt att koda bort missing-värdena?

      /Anders

      • Tackar och bockar.
        Intressant blogg, dina exempel och genomgångar är lärorika och samtidigt lättbegripliga.

        /Hans

  6. Hej SPSS-akuten!

    Det är så att jag har ett datasett med 10 beroende variabler som är avsedda att mäta ”punitive attitudes” och har värdena 1=instämmer helt 2= Instämmer delvis 3= vet inte/har ingen åsikt 4= Tar delvis avstånd och 5= Tar helt avstånd. Jag vill lägga ihop dessa till ett index, men jag vet inte riktigt hur jag ska skriva i ”Compute Variable” ska jag bara lägga ihop alla dessa med ett plus mellan dem? Eller bör jag skriva andra formuleringar också? AKUT!

    Tacksam för svar!

  7. Jag har en annan fråga om cronbachs alpha. Vi använder i en studie ett översatt frågeformulär med 10 frågor som mäter resiliens. Formuläret är inte validerat på svenska och är ett nytt formulär även på engelska, varför det finns dåligt med dokumenterade psykometriska egenskaper. Vi har 100 deltagare i studien. Jag skulle vilja göra en cronbachs alpha för att se om frågorna mäter den bakomliggande variabeln resiliens så som vi tänker. Bör jag göra analysen på hela gruppen eller ett stickprov? Hur många bör stickprovet i så fall innehålla?

  8. Hej

    Jag undrar över rekommenderad statistisk metod för att mäta om en viss samtalsmetod används i förekommande samtalsfall som jag utifrån 15 konstruerade kriterier skall analysera. Jag funderar på det som beskrivs om index av variabler…? eller andra tips?? / Camilla

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s