Läsarfråga: Instrumentvariabler

Q: Jag undrar hur det här med instrument variabler fungerar?

A: Instrumentvariabler använder man när det finns risk för omvänd kausalitet. Ett klassiskt exempel är ekonomisk tillväxt och inbördeskrig. Man vill undersöka om ekonomisk tillväxt minskar risken för inbördeskrig, men det är också rimligt att tro att inbördeskrig minskar den ekonomiska tillväxten. Om vi då undersöker korrelationen mellan de två kommer vi inte veta vad som orsakar vad.

Genom att hitta en variabel som kan tänkas orsaka ekonomisk tillväxt men inte inbördeskrig kan vi komma runt problemet. I länder där ekonomin bygger på jordbruk borde rimligtvis mängden regn påverka den ekonomiska tillväxten. Samtidigt så borde inte regn påverka risken för inbördeskrig, och inbördeskrig påverkar definitivt inte hur mycket det regnar.

Om vi då hittar ett samband mellan hur mycket det regnar i ett land och risken för inbördeskrig så kan man då dra slutsatsen att det måste vara så att regnet har gjort att den ekonomiska tillväxten ökat, vilket minskat risken för inbördeskrig. Det kan ju inet ha gått åt andra hållet.

Det här exemplet kan man läsa om i en berömd artikel av Miguel, Satyanath & Sergenti (2004) i tidskriften Journal of Political Economy: Economic Shocks and Civil Conflict: An Instrumental Variables Approach.

Statistiskt gör man det här I två steg. Först undersöker man effekten av regn på ekonomisk tillväxt. Därefter använder man regnnivån för att predicera värden av ekonomisk tillväxt. Därefter använder man de predicerade värdena av ekonomisk tillväxt som oberoende variabel i en ny regression där inbördeskrig är den beroende variabeln. Detta kallas Two Stage Least Squares. I SPSS hittar du det under ”Analyze->Regression->2-Stage Least Squares”. Du skriver där in din beroende variabel, din oberoende variabel och din instrumentvariabel (motsvarande regn).

10 thoughts on “Läsarfråga: Instrumentvariabler

  1. Hej!

    Här kommer en lite förvirrad fråga från två stackars c-uppsats skrivare: Vår hypotes är: En prestationsmodell påverkar de anställdas arbetsmotivation.Vi har operationaliserat ner arbetsmotivation i 6 olika faktorer. Lön, organisationsengagemang, arbetstillfredsställelse, självskattad arbetsprestation, feedback och autonomi. Vi har utfört en enkätundersökning där vi har haft med frågor som berör dessa faktorer. Vi har en kontrollgrupp som endast fått göra enkäten. Vi har en experimentgrupp som fått information om en ny prestationsmodell, att den ska införas på företaget de jobbar på och att de ska bli pilotgrupp -först därefter har de fått gjort samma enkät.

    Nu till problemet: Hur ska vi gå vidare efter vi har lagt in resultaten av enkäterna i spss? Vår oberoende variabel är ju som sagt prestationsmodellen och vår beroende variabel arbetsmotivation (de 6 faktorerna). Det känns som att vi inte ”har” någon oberoende variabel när man ska utföra analyser i spss…

    Tacksam för all hjälp vi kan få i detta förvirrande läge ☺

    • Hej!
      Er oberoende variabel är ju då om man har fått informationen om prestationsmodellen eller inte. Förhoppningsvis har ni separerat enkäterna från den gruppen från de andra? Då är det bara att lägga till en variabel som är 0 om man inte fått informationen och 1 om man fått informationen, och sen ha denna variabel som oberoende variabel.

      /Anders

    • Hej!
      Nej, det kan man inte riktigt säga. Korrelationsvärdet är ett mått som går mellan -1 och +1. -1 betyder att det är ett helt perfekt negativt samband, +1 att det är ett helt perfekt positivt samband, och 0 att det inte finns något samband.

      /Anders

      • För jag har sett att någon har skrivit så här:

        Dock är korrelationskoefficienten väldigt låg (-0,109), vilket innebär att endast 1 % av variationen i betyg kan förklaras av elevernas födelsekvartal. Varifrån kommer procenten, trodde det kom från korrelationsvärdet.

      • Okej, då förstår jag. Andelen förklarad varians kan man se inte utifrån korrelationskoefficienten, utan från R2 (R-square, alltså ska det vara R upphöjt till 2).

        Hur får man fram den? Jo, man tar helt enkelt Pearson’s R i kvadrat. -0,109*-0,109 = 0,012. Det betyder att 1,2 procent av variationen i den ena variabeln förklaras av den andra variabeln.

        /Anders

  2. Hej!
    Toppen att man kan få hjälp med SPSS här. Jag undrar om någon vet hur man lösenordsskyddar, krypterar data eller liknande i SPSS. Någon som vet?

    Vänligen
    Isabelle

    • Hej Fredrik!
      Jadu, Kaplan-Meier är en metod för att bedöma graden av överlevnad över tid i en population, och log rank är ett test för att se om två överlevnadsdistributioner skiljer sig åt. Det blir lite långt att gå igenom det här, men jag ska kanske skriva ett längre inlägg om det längre fram.

      /Anders

  3. Hej Anders!

    Jag gör en tenta i psykologi med spss och låtsas göra ett experiment, där 15 studenter i en experimentgrupp får högre belöning och 15 studenter i kontrollgruppen får lägre belöning. Hypotesen är att de som får högre belöning får bättre resultat på en tenta. Hur lägger jag in detta på ett korrekt sätt i spss? Den beroende variabeln är ju studieresultatet, alltså prestationen. Kan jag lägga in U, G och VG och sedan kontrollgruppen och experimentgruppen för sig? Och sedan ta ut en korrelation och t-test? Tänker jag rätt?

    Mvh

    Sara

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s