Om SPSS-akuten

SPSS-akuten grundades av Anders Sundell och drivs nu även tillsammans med Rasmus Broms. Vi är doktorander i stastvetenskap på Göteborgs universitet. Vi jobbar med statistisk analys, men är inte statistiker.

Syftet med SPSS-akuten är att hjälpa folk att komma igång med statistisk analys, och att förstå hur man ska tolka resultaten. Om man vill sätta sig in i matematiken bakom metoderna eller logiken bakom de olika statistiska antagandena rkeommenderas en lärobok i statistik eller ekonometri, till exempel Jeffrey Wooldridges ”Introductory Econometrics: A Modern Approach” eller Mark Sirkins ”Statistics for the Social Sciences”.

Vi gör vårt bästa för att informationen här på SPSS-akuten ska vara korrekt. Texterna har emellertid inte undergått traditionell peer review. Om du vill använda dig av SPSS-akuten i din uppsats kan det därför vara en bra idé att stämma av med din handledare först.

Om du vill citera SPSS-akuten i din uppsats, använd följande citeringsformat:

Sundell, Anders (2009): ”Guide: Regressionsanalys” spssakuten.se, hämtat 2012-10-05. http://spssakuten.wordpress.com/2009/12/21/regressionsanalys-1/

Det vill säga, namnet på författaren till just det inlägget, året då inlägget skrevs, namnet på inlägget, spssakuten.se och datumet då du läste på sidan, samt adressen till inlägget.

101 thoughts on “Om SPSS-akuten

  1. Jag läser bloggen och frågorna med spänning. Jag ska till att räkna på om resultat (mätt med en Likert-skala, ”alltid”-”aldrig”, 6 punkter men bara 3 får poäng) efter 6 mån behandling kan predicera utfallet efter 3 år. Jag behandlar skalan som en intervallskala, trots att det kanske inte är så riktigt alla gånger. Någon som har en idé hur jag ska göra?
    /Suzanne

  2. Hej!
    Skulle ni kunna skriva ngt om hur man beräknar effektstyrkan och gör powerberäkningar i SPSS, närmare bestämt hur man räknar ut hur många deltagare man behöver i sin studie för att få 80% power?

    // Sanna

  3. Hej,

    jag har 3 perioder av longitidinell uppföljning på en VAS-skala. Jag vill visa de i ett linjediagram med konfidensintervallet. Får inte till det, missar jag något?

    Vänligen Christer

  4. Hej!

    Vi gör en enkätundersökning där vi har olika skalor för våra tre olika variabler. Den beroende variabeln har en nominalskala och de två oberoende har ordinal- respektive kvotskala. Finns det något smidigt sätt att ta fram ett samband mellan dessa tre variabler om vi vill titta på i vilken utsträckning som de oberoende variablera korrelerar med varandra och hur dessa påverkar den beroende? Eller borde vi överväga att omformulera frågorna så att vi får samma skalor?

    Vänligen
    Linn

    • Hej, om du har en beroende variabel på nominalskalenivå kan till exempel Cramer’s V vara ett bra mått. Eta kan också fungera. Det finns dock inget om dem här på bloggen, så jag får hänvisa till Google!

      /Anders

  5. Hej! Jag har tänkt undersöka hur ett värde (Gini) påverkas utifrån vilken partifärg regeringen har (röd/blå) i ett land (Sverige!). Detta tänkte jag dessutom försöka utläsa mönster i tid av (Blir skillnaderna mindre med tiden) Är lite osäker på hur jag ska lägga upp det.

    Om Gini var 0,31 år 2002 och Gini var 0,34 år 2003 bör jag väl rimligtvis skapa en variabel för 2003 som tillskriver regeringen detta år för förändringen på 0,03? Dessutom vill jag ju ha en nominal variabel för partifärg (röd/blå) som ska kunna tillskrivas förändringarna över tid de år de varit i regeringsmakt. Kan ni bringa någon reda i hur jag bör gå till väga för att göra rätt koppling mellan variabler?

  6. Hej, Vi är studenter från Södertörnshögskola som jämför aktierekommendationer från affärstidningar och banker. Vi har valt 4 banker och 4 affärstidningar. Slutligen ska vi jämföra utfallet av alla affärstidningar och banker. Vi väljer ut aktierekommendationer som dessa tidningar eller banker har lagt ut, och sedan studerar om kursen har gått upp dagen efter rekommendationen, den femte, den tioende och den trettionde dagen. Jag vill använda SPSS signifikans test för att se om det råder någon skillnad mellan bankers och affärstidningars aktierekommendationer. Hur ska jag gå till väga,vi har totalt 400 rekommendationer från banker och 200 från affärstidningar, jag vet inte hur jag ska sätta in dessa siffror i SPSS heller.

    Hälsningar

    Pablo

    • Blir svårt att förklara här. Låter som att ni först måste göra om variablerna till dummyvariabler. Hör av dig till mig på statistik112@hotmail.com så kan du mer detaljerat förklara vad ni ska göra och hur ert material ser ut.

  7. sitter och slavar med tenta i omvårdnads statistik och har aldrig jobbat med SPSS förut. Gissa om jag blev glad när jag snavade om denna sida :-D Halleluja! Pris ske Gud! Två fråger till avklarade.

  8. Hej!
    Jag håller på i spss med syftet att titta på en eventuell korrelation mellan upplevelse av studier(mätta på skala neg1-5pos) och personlighetsdrag i nominell variabel 0-1. vilken typ av korrelation passar detta? Måste jag computa en ny variabel för upplevlelse skalan där jag räknar på resultatet för att kunna ha en y och en x axel i korrelationen? Jag har 5 items om upplevelsen så det blir väl konstigt att göra 5 korrelationer?

    Undrar även om chi square test och om man måste använda detta när man har nominella variabler?

    Annars hur gör jag ett t-test som passar denna? Independent har jag tänkt…

    Så otroligt tacksam för svar! Och Tack för att denna sida finns, för oss vanliga!

    Mvh

    Sara

    • Hej Sara!

      Du kan prova Spearmans rho i syfte att mäta korrelationen, men du bör göra något form av index för variabeln ”upplevelse”. Du kan föröska förtydliga din fråga och återkomma till mig på statistik112@hotmail.com så kan nog hjälpa dig.

  9. Hej! Jag ska jämföra data mellan barn med hörselnedsättning och hörande åldersmatchade kontroller och ska använda paired samples t-test. Måste jag manuellt skriva in varje matchat par i en rad, el kan jag t ex klippåklistra hela sjoket med variabler? Nu är både normalhörande och ickehörande i en lång kolumn.

    Tack för denna sida! Kul att ni är flera stycken nu!

  10. Jag förstår inte varför det ska vara parvisa observationer? Hörande barn och barn med nedsatt hörsel är oberoende av varandra. Är det något prov de gjort var för sig två ggr?
    Du kan kontakta mig på statistik112@hotmail.com så kan vi reda ut detta.

  11. Vad ska jag använda för denna uppgift?

    Du tror att det är en avgörande faktor om man i vanliga fall läser en lokal morgontidning eller en rikstäckande morgontidning för hur många rikspolitiker som man kan namnge när man ser dem på bild. Du är vidare intresserad av om förmågan att namnge politikerna förändras beroende på temperaturen när man läser morgontidningen och temperaturen vid namngivningstillfället. Du gör ett experiment för att studera om temperaturen ger något extra bidrag till hur många politiker man kan namnge utöver den förväntade effekten av vilken sorts morgontidning man läser.

    • Den första meningen ”makes no sense”.

      Y=hur många politiker man kan namnge
      X1= temperatur
      X2= typ av morgontidning (förmodligen en dummyvariabel)

      Mitt tips är att köra en regression på ovanstående modell.
      statistik112@hotmail.com

      • Tack för snabbt svar! Den första delen av uppgiften har jag fixat. Den andra delen när temperaturen kommer in i bilden föreslår du alltså en regression?

      • Ja, då kan man nämligen titta på den partiella korrelationen (bocka för Part correlation det när du gör regressionen)
        Tar man detta värde i kvadrat får man en indikation på hur mycket en viss variabel unikt bidrar till R2-värdet.

    • Vilken typ av regression föreslår du? Nedan kan du se datan jag arbetar med.

      Temp. vid läsning Temp. vid rapportering antal politiker
      21 21 21,00
      21 21 17,00
      21 18 14,00
      21 18 19,00
      18 18 18,00
      18 18 21,00

      • Har du bara 5 observationer per variabel? Enligt din data är det ingen skillnad mellan Temp. vid läsning och Temp. vid rapportering. Att kopiera och klistra in tabeller funkar inte så bra här på bloggen. Jag hänsvisar till min mail statistik112@hotmail.com om du vill diskutera detta vidare.

  12. Hej, jag undrar om ni vet hur man gör Grubbs´ Test i SPSS?

    Jag vill göra det innan jag gör t-test för att få veta vilka uteliggare jag har i mitt datamaterial. Jag har letat i någon timme nu i SPSS, jag antar att det är för att jag är nybörjare på SPSS som jag inte hittar det…

    Förövrigt så vill jag även tacka för denna sida då den hjälpt mig en hel del i att komma igång med mitt doktorandprojekt!

    Charlotte

  13. Vi håller just nu på att lägga in vår data i SPSS och har en fråga. Vi vill gruppera ett antal kolumner till en kategori och på så viss skapa sex stycken olika kategorier för att beräkna korrelationen mellan dessa.
    Vi undrar om detta är möjligt i SPSS och i så fall hur vi gör?

  14. Hej! Jag har gjort t-test och box-plots i SPSS, då jag jämför företags förbättringstakt vad gäller energiförbrukning före och efter certifiering av ISO 14001.
    Jag upptäckte nu att jag gjort ett misstag då jag använt mig av ordinalskala istället för nominalskala som det egentligen ska vara i de fall då jag skiljer på företag före certifiering, som jag döpt till 1, och företag efter certifiering, som jag döpt till 2.
    Vet ni om detta spelar någon roll för de resultat jag får fram? Jag har gjort om ett av alla mina tester och medelvärden, varians, p-värde osv blev det i alla fall inte ngn skillnad på i det försöket. Vet ni om det ska spela ngn roll i denna situation om jag har använt mig av ordinalskala?
    Vänlig hälsning Charlotte

  15. Hej! Jobbar med excellfill som går bra att öppna i SPSS men har följande problem när jag ska skapa filtervariabler på SPSS: A relational operator may have two numeric operands or two character string operands. To compare a charachter string to a numeric quantity, consider using the STRING or NUMBER function.
    Vad betyder det?
    Tacksam fö hjälpen!
    Lui

  16. Hej! Hur skapar jag en linjegraf med error bars för en kontinuerlig variabel med 3 mättillfällen (pretest, posttest 1, posttest 2 av samma individer) uppdelad på två grupper (experimentgrupp och kontrollgrupp)? Tacksam för råd! Har sökt ‘överallt’ och provat själv men får inte till det. /Lars

    • Hej,

      välj ett linjediagram med färgerna (den andra) i Chart Builder, lägg till den kont. variablen på y axeln, det går att dra alla tre mättilfällen dit och sen uppdelningen uppe i set colourrutan. Och sen errorbar i egenskapfönstret för diagrammet. /Christer

  17. Hej!

    Tack för en bra sida! Det är så att jag ska göra en studie där jag bland annat ska undersöka huruvida tre olika grupper är för eller emot en sak. Alternativen är Helt emot, Delvis emot, Delvis för och Helt för. De två första alternativen kodar jag sedan om till 0 och de två sista till 1. Om vi nu säger att 0 (Emot) är beroende variabel och de oberoende variablerna t.ex. är kön, ålder och erfarenhet i branschen, vilken modell ska jag då använda? Nu undersöker jag alltså varje grupp för sig. Om jag sedan tar 0 (Emot) som beroende variabel och sedan tar de tre olika grupperna som oberoende variabler, för att se hur mycket de olika grupperna ”påverkar” Emot. Vilken modell ska jag då använda? Kan jag göra på ett annat sätt som är bättre?

    Jag är väldigt ny i ämnet så jag skulle vara otroligt tacksam för hjälp!

    Med vänliga hälsningar
    Robin

  18. Vill inleda med att poängtera att jag inte tillhör SPSS-akuten, så att någon inte blandar ihop min blogg med SPSS-akuten.

    För att besvara din fråga. Du kan inte ha en variabel med endast en kategori. Då är det inte en variabel längre, utan en konstant… det finns ingen variation. I det här fallet borde din beroende variabel vara de svarskategorier som du kodat som 0 respektive 1. Då har du en s.k. binär variabel. När man har en binär beroende variabel så använder man sig av logistisk regression. Hoppas att detta gav dig en vägledning

  19. Hej!

    Kan man få konfidensintervall för en skillnad påvisad med Wilcoxon signed-rank test?

    Jag är igång med ett studie där gravida kvinnor följs med ett bestämt blodprov genom graviditeten. Blodprover tagna vid tre olika tillfällen under graviditeten (T1, T2, T3) ska jämföras var för sig med blodprover innan graviditeten för att undersöka om det inträder en signifikant ändring. Alltså – baseline jämfört med T3, baseline jämfört med T2 och baseline jämfört med T3. Det är samma individer som följs genom hela graviditeten, min grupp är alltså homogen genom hela försöket och blodproven som jämförs är ”parade”. Dock är det bara 14 kvinnor som följs vilket betyder att mätningarna vid T2 och T3 inte är normalfördelade. Jag kan därför inte använda paired t-test utan blir tvungen att använda det icke-parametriska Wilcoxon signed-rank test.

    I SPSS väljer jag Analyze>Nonparametric Tests>Legacy Dialogs>2 Related Samples. Under Pair1 plottar jag in Baseline som Variable1 respektive T3 som Variable2, sätter hack för Wilcoxon. Mycket tjusigt dyker Descriptive Statistics, Ranks och Test Statistics upp med p-värde som styrker en signifikant skillnad, men inget konfidensintervall för denna skillnad. Kan man få fram ett sådant på något klurigt vis?

    Tusen tack för hjälp!

    Vänlig hälsning
    Rebecka

  20. Hej!
    För närvarande håller jag på med min mastersuppsats, och har nu upptäckt att jag har råkat skriva en variabel i enkäten två gånger, alltså SAMMA fråga förekommer TVÅ gånger. Jag har alltså dubbletter av en variabel. Det är en variabel som deltagarna kan skatta från 1-7, varpå deltagarna ibland har skattat olika på dessa LIKADANA variabler. Hur ska jag hantera detta på bästa sätt? Slå ihop dem till en variabel (hur gör jag detta i så fall?), ta bort en av dem (deltagarna har ibland skattat olika på variablerna), eller något annat? Hjälp!

    Ania

    • Hej Ania!

      Det är en knepig situation. Det finns inga rätta svar. Mitt råd är att du får bestämma dig för en variabel och i metoddiskussionen kritiskt refketera över både validiteten och reliabiliteten med denna variabel.

      Du kan (om du vill) skapa en ny variabel som bygger på medianen (eftersom du har ordinaldata) mellan dessa två.
      I Transform–>Compute kan du skriva MEDIAN(X1, X2) där X1 och X2 motsvarar namnet på dina två variabler.

      Hälsningar,
      spssstatistik.wordpress.com

  21. Vi skrivet ett papper och har ett problem. Vi gör en multinominal logistisk regression i SPSS 20 och fattar inte riktigt vad vi gör för fel och hur vi kan åtgärda det.
    Det står så här i output alldeles i början:

    Warnings
    There are 996 (66,7%) cells (i.e., dependent variable levels by subpopulations) with zero frequencies.

    Vi undrar:
    a) Vad betyder det?
    b) Hur åtgärda?

    Tack på förhand för hjälp
    Ingalill och Maria

    • Det betyder att du har ca 67 % av dina celler jar värdet 0; finns med andra ord ingen variation i dina förklarande variabler. Du kan se att du har 0-värden genom att göra korstabeller (Crosstabs i SPSS) mellan de x-variabler och den y-variabel du önskar undersöka.

      Lösning 1: Få in mer datamaterial (ej kostnadseffektivt).
      Lösning 2: Slå ihop kategorier. I värsta fall kanske man får göra om kontinuerliga variabler till kategoriska. Då förlorar man ”information”; dvs. när man transformerar variabler från en högre till lägre skalnivå.

      • Vi har redan kollat det och har ingen underkategori med 0 observationer. iv har några med 2 observationer men det är ju inte vad som indikeras. Kan det vara något annat som vi missat att kolla? Eller nåt fel i hur vi tänker kring den multinominala metoden. I SPSS guide står att man ska ha en kategorisk beroende variable, men det kan ju inte stämma då det ju i så fall är en binär logistisk regression man ska ta. Vi har tre kategorier i vår beroende variabel.
        Har du nåt mer tips?

      • y vs x1
        y vs x2
        :
        :
        y vs xk

        Är det så ni kontrollerat?

        Har ni sett till att saknade värden kodats på rätt sätt så att SPSS vet att det rör sig om ”missing values”?

        Att en variabel är kategorisk betyder att den har minst 2 kategorier, så ni är inte fel ute.

      • Ja, det är så vi kontrollerat och vi har inga missing values i det aktuella materialet.

    • Då är det mycket märkligt. Jag kan inte se någon annan anledning till att ni får detta meddelande än den jag redan skrivit.
      Ni kanske ska fundera om ni inte borde frångå 3 kategorier på er BV och köra binär logistisk regression istället. Kolla med er handledare? Ni skriver inget om vad ni har för variabler och vad ni ska analysera.

  22. Hej!

    Jag vill testa för skillnad i en liten studiegrupp – vad är mina möjligheter, vad är korrekt att göra?

    Studiegruppen har en oberoende variabel – tid – och en beroende variabel – koncentration. Vid olika tidspunkter mäts koncentrationen, låt oss säga 4 tidspunkter således att min oberoende variabel har 4 ”levels”. Studiegruppen är liten (20 deltagare) och vid varje tillfälle/level bidrar inte alla deltagare med mätningar.

    Totalt 13 deltagare bidrar dock med mätningar från alla 4 tillfällen/levels och borde teoretiskt sett kunna jämföras med repeated measures ANOVA. Jag har försökt mig på att testa för normalfördelning i gruppen med SPSS (Kolmogorov-Smirnov och Shapiro Wilk) och dessa verkar skatta normalfördelning (p>0.05 i båda test). Kan man förlita sig på dessa normalfördelningstest med så få observationer? Och i så fall, är det korrekt att testa observationerna från mina 4 tillfällen/levels en och en (totalt 4 normalfördelningstest), eller ska de kombineras i ett gemensamt test? Är det mer korrekt att göra icke-parametrisk ANOVA (Friedman’s), och finns det i så fall begränsningar med hänsyn till antal observationer i gruppen också här? Bör jag använda några helt andra test?

    Tusen tack för hjälp!

    Vänlig hälsning
    Rebecka

    • Och en helt annan fråga… När man ska testa för normalfördelning innan man utför oparat t-test, ska deltagarna testas som en grupp eller två grupper var för sig?

  23. Hej! Jag har blivit lite förvirrad och skulle behöva lite hjälp med att klura några frågetecken.

    Jag håller på med en (enkät)-studie där jag har tre manipulationer (inkl. kontrollgrupp). Enkäten i sig består sedan av demografiska frågor såsom kön, ålder, utbildning etc. Den innehåller även tre olika skalor som mäter tre olika fenomen. Studien görs för att studera individers intresse (består av tre frågor) för ett yrke, och eventuella könsskillnader i detta.
    Jag har fått för mig att ANOVA och MANOVA är de analyser jag ska genomföra på mitt material, men just nu är jag förvirrad över vad som är min(a) beroende och oberoende variabler.

    Tacksam för hjälp!

    • Hej Ania!
      Vad som är beroende respektive oberoende variabel/er beror helt och hållet på din frågeställning.

      Du nämner bland annat variabelerna intresse och kön. Du måste ställa dig följande (logiska) frågor.
      1. Är det intresset som påverkar vilket kön man har?
      eller
      2. Är det individens kön som påverkar vilket intresse man har?

      Om du tänker efter så inser du att din beroende variabel (y) är intresse och din oberoende variabel (x) är kön. Det är kön som påverkar vilket intresse man har och inte tvärtom.

      Om du vill diskutera ditt projekt i detalj kan du kontakta mig på statistik112@hotmail.com

  24. Hej!
    Jag har en fråga om outliers. Jag har några stycken i min data och försöker bestämma hur jag ska hantera dem. Jag läste i en spss bok att om man jämför ”the mean” med ”the 5% trimmed mean” så kan man se hur starkt outliers påverkar datan, och om de inte är så starka så kan man behålla dem. Däremot, om ”the mean” och ”the 5% trimmed mean” skiljer sig så måste man antingen ta bort outliers eller ändra deras värde, Det jag har svårt för är att hitta någon referens eller hjälpmedel där det står hur man ska ändra värdet? Jag vet att man kan sänka eller höja deras värde så att de fortfarande är högst eller lägst i fördelningen men inte lika extrema.
    Har ni tips eller förslag på HUR man ska ändra värdet på outliers?

    Tack för hjälpen!

  25. Hej!

    Tack för bra sida!

    Jag har en fråga om kontrollvariabler vid regressionsanalys. Som jag har förstått det ska man väl välja kontrollvariabler som kan ha påverkan både på den beroende och den oberoende variabeln. I vårt fall vill vi testa hur valutor påverkar rörelseresultatet i ett företag. Vi vill då använda t.ex ränta som kontrollvariabel eller företagets omsättning. När vi gör detta påverkas dock toleransnivån i regressionen och går ofta från 0,9 ner till så lågt som 0,2 för de oberoende variablerna. Vi har lärt oss att toleransnivån bör ej ligga under 0,8.

    Har ni något förslag på hur vi kan göra? Toleransnivån går ju ner just för att det finns en korrelation mellan den oberoende variabeln och kontrollvariabeln.

    Tack på förhand!

    Mvh Patrick

  26. Hej!
    Har en akut fråga och jag kan inte hitta svaret här.. Vi har två, från början, ordinala variabler. En av dem har vi sedan gjort om till en dikotom variabel. En är alltså nu ordinal och den andra är dikotom, vilket sambandsmått ska vi använda? I min kurslitteratur föreslår de spearmans rho, men den finns inte i spss. Ska vi behandla variablerna som ordinala fastän vi gjort om den ena?
    Hjälp!
    Oerhört tacksam för svar!
    Mvh Hanna

  27. Hej, jag har en fråga angående uttrycken i Select Cases: If:

    Jag har ett dataset där jag först och främst vill skilja ut de som jobbar minst deltid (1 < F128) och är mellan 20 och 65 år (1 < alder9 < 8). Jag ser i data view att filtreringen lyckas. Sedan vill jag ur denna grupp skilja ut en undergrupp bestående av de som svarat att de är egenföretagare utan anställda (f127sing=6) eller egenföretagare med max 9 anställda (f127sing = 7) varur jag i sin tur vill ha de som tillskrivits en SSYK-kod mellan 2000 och 2470. Här går det åt skogen. Jag tror att jag lyckas filtrera ut egenföretagarna, men I data view ser jag att egenföretagare med en SSYK-kod utanför intervallet inte filtrerats bort. Jag har försökt dribbla med parenteserna, men går bet. Så här har jag t.ex. skrivit.

    1 < (F128) & 1 < (alder9) < 8 & ((f127sing) = 6 & (2000 <= (ssyk) <= 2470)) | ((f127sing) = 7 & (2000 <= (ssyk) <= 2470))

    Jag antar att jag inte behärskar reglerna för logiska uttryck ordentligt.

    Hur tror ni att jag borde skriva?

    MVH

    Simon

  28. Hej!
    Jag skall precis börja ”städa” min data (missing values, outliers, normalitet etc.) och har stött på lite frågetecken som jag inte hittar några egentliga svar på i diverse böcker (ex. Tabachnick & Fidell, 2007).

    1) Skall ”städning” göras på ALLA items i ens datamaterial? Alltså, alla ENSKILDA items inom skalor/demografisk data?
    2) Jag skall slå ihop några av mina skalor till delskalor, gäller min första punkt fortfarande då, alltså att alla items först ENSKILT skall vara städade? Eller gör man endast detta för den ihopslagna (del)skalan? Eller skall den överhuvudtaget ”städas”? Vad gäller outliers, är det endast de fall som har en asterisk i boxplots som är de fall man bör se över/hantera, eller även de som inte har det men som presenteras i boxploten?
    3) När i analysarbetet genomför man en reliabilitesanalys på sin skala? Före/Efter man gjort sina andra analyser (ex. ANOVOR)? Gör man reliabilitesanalys på enskilda items i en skala (alltså, man lägger in alla items i analysen för att sedan se hur de enskilt påverkade skalan) eller gör man detta på den ihopslagna (del)skalan, eller kanske både och?

    Väldigt tacksam för svar!
    Ania

  29. Hej!
    Jag skall genomföra en two-way between groups-anova och har lite funderingar kring screening-processen.
    Skall man screena (städa) materialet uppdelat på sina grupper (i mitt fall kön- man/kvinna) eller skall man screena HELA materialet där alltså alla mina case oberoende av min ”grouping variable”. För vad jag förstår efter att ha läst Tabachnick och Fidell och deras medföljande exempel (kapitel 4) skall den här typen av ANOVA behandlas som ”grouped data” och skall screenas efter det. Eller? Eller ska man screena både separat baserat på grouping variable och utan att ha delat upp det?
    (Att titta på könsskillnader är alltså centralt i min analys).

  30. Vilket är det bästa sättet att hantera missing values som är mindre än 1,9% på enstaka variabler?
    Ersätta med medelvärdet, multiple imputation eller något annat?
    Jag vill helst undvika att radera deltagarna.

  31. Hej!
    Jag håller på med en klinisk studie där jag utvärderar sekundärprevention efter hjärtinfarkt (Hur väl mål för rökstopp, blodfetter, blodtryck, fysisk aktivitet, läkemedel och blodsocker uppfylls). Det är tänkt jag ska titta på allvarlighetsgraden av sekundärprevention…dvs hur många uppfyller ett, två tre, fyra resp fem och sex av dessa mål…kan man göra detta direkt i SPSS?

    All hjälp är extremt uppskattad! // Mia

    • Hej Mia-Li,
      jag heter christer och jobbar på sahlgrenska (med ryggar).
      Om du bara snabbt vill ha fram antal av de som uppfyller de villkor du satt upp (tröskelvärden) så kan du använda autofilter i excel tex. Alltså ange för blodfetter det tröskelvärde du valt – då syns ju antal som uppfyller och inte uppfyller det. Och så vidare. Så skulle jag gjort i alla fall.

      Christer 0701 40 62 66

  32. hej
    gör examensarbete. Jag skall jämföra 4 olika räknekammare. Jag har slutkoncentrationen på 4 olika räknekammare. Jag vill jämföra medelvärdet på ena gruppen mot 3 andra grupper. Hur gör man?

  33. Hej!

    Jag ska se hur många pat inkluderade i mitt arbete som uppfyllt optimalt blodtrycksvärde 140/90…
    De med optimalt diatoliskt tryck har jag i en variabel (DBP_opt) där 1=uppfyllt mål och 0=icke upfyllt mål, detsamma gäller för SBP (SBP_opt)

    Jag undrar hur kan jag lyckas slå ihop dessa så att jag får en variablel (BP_opt) där de med både optimalt systoliskt och diatoliskt blodtryck blir satta som ”1″ och övriga ”0″…

    har testat en hel del med recode into same/different variables och include cases if, men får det inte att fungera…antingen gör jag ngt litet fel eller så är jag ute och cyklar helt, hittar inget på SPSS hjälpfunktion heller…:s

    All hjälp uppskattas hur mycket som helst!

    Mvh // Mia

  34. Hej!

    Jag vill räkna ut medelvärdet för ålder i min data. Jag har deltagarnas personummer, kan jag använda dessa direkt i spss eller måste jag först räkna ut allas ålder för hand och sen köra medelvärdet? Hade underlättat om spss kan förstå personummer men vet inte om det är möjligt och hur man skulle göra det?

    Tack för hjälpen!!

  35. Hejsan, jag skulle vilja göra om fyra stycken labels till en. Har data från en undersökning som gäller inställning till globalisering som är uppdelad i fyra kategorier, men inriktar sig på ”individ, kommun, Sverige, världen”. Hur gör jag för att göra om dessa till en label, där datan finns samlad i en?

  36. Vilken version av spss använder ni? Tittar man på ibms hemsida finns lite väl mkt att välja på som har med spss att göra. :-)

  37. Hej, är starkt behov av hjälp!

    Hur laddar jag ner spss? Har gått in på http://www.qog.pol.gu.se för att därefter ladda ner olika data, men det enda jag då får upp är en mängd olika siffror och koder. Jag förstår verkligen ingenting. Hur kan jag ladda ner programmet så att jag kan få tillgång till att själv göra min egen undersökning?

    Mvh Astrid

  38. Hej. Om jag har en fråga som är markerad med alternativen 1-4 där det framgår att 1 motsvarar t.ex ”lite” och 4 motsvarar ”mycket”. Räknas detta då som en ordinal eller intervallskala?

  39. Hej, gör mitt examensarbete och skulle behöva lite råd. Kan jag använda ett parat T-test till Grupp A (16 deltagare) för att mäta skillnader före och efter (tid) inom gruppen samt ett parat T-test till Grupp B (16 deltagare) att mäta skillnader före och efter (tid) inom gruppen? Jag behöver även jämföra de båda gruppernas effektskillnader sinsemellan och undrar då vad jag kan använda? Båda grupperna utsätts för olika saker men mätverktygen är givetvis samma.
    Tack på förhand, hoppas på hjälp :)

  40. Hej!
    Jag undrar hur man överför data från en SPSS fil till en annan SPSS fil, jag behöver alltså infoga en ny rad med information i en befintlig fil? Vet inte huruvida det är annorlunda om man använder Mac?

    Tack för hjälp

  41. Hej!

    Jag har genomfört en faktoranalys på en del enkätdata avsedd att mäta ett antal skalor. Jag har nu slutit mig till vilka item som laddar i vilka faktorer – skalor i min enkät. För varje respondent vill jag framöver beräkna en faktorpoäng. Bör jag göra detta som ett medelvärde av de items som ingår i faktorn eller skall jag vikta items utifrån faktorladdningarna på något vis?

  42. Hej! Har en fråga
    Om jag har två medelvärde och vill testa om det föreligger signifikant skillnad mellan dem eller inte. Vilken testmetod kan man välja i SPSS?
    OBS! jag har enbart två medelvärde i siffror. inga variabler

  43. Hej!

    Tack för en fantastisk blogg. I en uppsats av Michael Clemens ‘Counting Chickens When They Hatch: Timing and the Effects of Aid on Growth’ 2004 testar författaren biståndets effekt på ekonomisk tillväxt med hjälp av en ”laggad” regressionsmodell.

    Jag har för avsikt att använda en liknande laggad modell i en uppsats och undrar om det är något ni har erfarenhet av. Framför allt är jag intresserad av konkreta tillvägagångssätt för att kunna använda en laggad modell i på ett dataset. I min kurslitteratur från 30 hp statistik nämns det bara i förbifarten.

    Vore hemskt tacksam för svar, läsanvisning eller kanske t.o.m. ett blogginlägg!

    Hälsningar,
    Filip

  44. Hej,

    Hej,
    Jag har en fråga angående kontrollvariabler. När man gör en multipel regressionsanalys kan de oberoende variablerna korrelera med varandra Jag förstår dock inte riktigt detta. Ett exempel: om den beroende variabeln är lön och den oberoende variabeln är ålder. När man då lägger till ytterligare en variabel, exempelvis utbildning, så ökar b-koefficienten på ålder. Hur förklarar man detta? Varför kan värdena på kontrollvariablerna öka/sjunka när man adderar fler oberoende variabler i modellen?

    Hälsningar
    Nathalie

  45. Hej!
    Tack för en bra sida, som verkligen är till stor hjälp för många!
    Min fråga rör logistisk regression. Jag har två item (förklarande variabler) på ordinal nivå 0-3 klarar inte – klarar, som predikterar ett dikotomt utfall (utfallsvariabel). Jag har gjort en sammanslagning av de två itemen till en totalsumma (0-6p), med en cut-off nivå på 0-1/2-6p vilken är identifierad med ROC-kurvor och den har även en kliniska användbarhet. De två itemen har mycket hög prediktionsförmåga, vilket gör att det blir tomma kategorier och väldigt få nummer att räkna på i den logistiska regressionen. Jag har provat att slå samman kategorier, samt att använda de två förklarande itemen var för sig, men det kvarstår fortfarande tomma kategorier, vilket ger missvisande uträkning. Har du någon lösning kring mitt problem? Måste jag lämna logistisk regerssion och göra beräkningar i korstabell istället? Tacksam för svar!
    /Hanna

  46. Hej! Vi är tre personer som vill koda in vårt material i SPSS samtidigt, på olika datorer. Hur går vi sedan till väga för att sammanföra materialet till ett?

  47. Hej!

    Jag vill få reda på huruvida det finns en statistiskt signifikant skillnad mellan vilken erfarenhet kvinnliga respektive manliga ministrar har. Jag har data för totalt 450 ministrar från 16 olika regeringar (dvs en totalstudie och inte ett urval). Graden av erfarenhet har jag redan definierat i ett index, vars värde kan ha 0; 0,25; 0,5; 0,75 och 1. På en aggregerad nivå, dvs när jag tittar på alla ministrar oavsett regering, kan jag göra ett Chi-2 test. Problemet är att jag vill bryta ned resultaten per regering, med följden att de observerade värdena sällan överstiger 5, som ju är ett gränsvärde för att göra Chi-2 testet. Har försökt att göra Fisher’s exakta test, men eftersom det index jag skapat kan ha 5 olika värden innebär detta att min korstabell med variablerna kön och och indexvärde överstiger antalet celler som är satt som gräns för Fisher’s exakta test (som ju är 2×2 celler). Skulle tacksamt ta emot hjälp med hur jag ska hitta ett passande signifikanstest!

    Tack på förhand!

  48. Hej!
    Jag försöker att mata in missing values enligt den beskrivning ni angett samt på ett annat sätt jag fått lära mig. Tyvärr blir utresultatet (i Frequencies) inte konsekvent och jag undrar vad det kan bero på.
    1. Jag matar in genom att h-klicka under tabellrubriken ”Missing” t ex 3 och 4 i ”Discrete missing values”. Funkar jättebra på flertalet av frågeresultaten. Men är inte konsekvent på alla. På vissa av frågorna separeras resultatet. 3 och 4 kommer ut som egna resultat och under missing står ”system”.
    2. Försökt att åtgärda ovanstående genom att följa instruktionerna från er, genom omkodning och välja ”All other values” i ”old values” och ”system missing” i ”new values”. Resultatet blir ändå detsamma.
    Jag har letat efter eventuella skillnader mellan frågorna i Data view, men kan inte hitta några ledtrådar.
    Tacksam för hjälp!

  49. Hej!
    Jag undrar hur jag gör för att skriva ut ett case i taget i SPSS. Jag skulle alltså vilja skriva ut hela strängen, alla variabler, för en individ i taget för att manuellt koda om i annan fil. Går detta att lösa?
    Hälsar,
    Caroline

  50. Hej!

    Bra blogg!

    Jag har en fråga kring ett material där annonser har utvärderats. I mätningarna får respondenterna ta ställning till om de observerat annonsen, hur noggrant de läst annonsen, hur välkänd annonsören är, om de ska köpa produkten osv. All data består av skalfrågor och jag försöker genom regressionsanalys se om jag kan hitta vilka frågor som driver till köp (dvs köp är den beroende variabeln).

    Allt är i samma enhet så jag antar att jag inte behöver standardisera variablerna. När jag kör fram regressionen så får jag väldigt bra förklaringsvärden för regressionen. ”Problemet” är att en av de oberoende variablerna (om annonsen medförde nytta för konsumenten) får väldigt höga värden på koefficienten (som dessutom är signifikant). Den korrelerar också starkt (upp emot 0.8) med flera av de andra oberoende variablerna (samt den beroende variabeln), dvs autokorrelation verkar vara fallet.

    För att komma till bukt med detta plockar jag bort denna variabel och gör regressionen stegvis. R2-värdet sjunker såklart och en annan parameter blir dominant.

    Hur skulle ni ta er an problematiken kring autokorrelationen eller ska jag helt enkelt bortse från den, dvs att det är underförstått att en parameter såsom Nytta kommer ha stor innebörd?

    Sen är jag lite osäker på hur interceptet (i detta fall 4,2) ska tolkas jämfört med de oberoende variablerna (ett exempel +0,11). Om interceptet är 4,2 – ska jag då tolka det som 4,2% och den oberoende variabeln som 0,11% (eller som 11%)?

    Stort tack på förhand

  51. Hej! Jag undrar om ni kan förklara vilket test man bör använda till följande:
    En patientgrupp har en total population på 150 pers. Alla har fått samma behandling och vi vill undersöka om den har hjälpt. Alla dom får en enkät. 31 st besvarar enkäten. 11 svarar att de blivit helt hjälpta av behandlingen, 15 svarar att de blivit delvis hjälpta och 5 svarar att de inte blivit hjälpta alls.
    Vi vill även veta om de blivit av med sina symptom: Av de 31 personerna har 27stycken samma omgivningsfaktorer som innan behandlingen, och av dessa 27 är 3 helt fria från symptom och 23 har kvar symptom, 1 faller bort pga att den även fått annan behandling. Hur räknar vi på detta?
    Slutligen vill vi se om de som har kvar sina symptom har lärt sig hantera symptomen:
    10 /23 kan ej hantera, 13 av 23 kan hantera. Hur räknar vi på detta?

    Tacksam för svar! =)

    • Ni kan inte förvänta er att Anders ska kunna hinna besvara era frågor. Googla på spss hjälp så hittar ni andra som kan hjälpa er.

  52. Hej! Jag har gjort en korrelation i SPSS och den ser ok ut, men när jag ska skriva ut den är megastor så det går inte. Hur gör jag för att kunna minska i output och kunna skriva ut? Tacksam för hjälp. Elisabeth

  53. .hej,
    Jag ska göra en korrelation analys på två eller flera variabler. Och det står att jag ska diskutera skalnivå på den variabel jag undersöker samt föreslå en testmetoden som är tillämplig för den skalnivån. Men förstår inte riktigt vad jag ska göra. Kan ni hjälpa mig ?

  54. Hej,
    Bra blogg! Har en fråga om kodning av ett dataset som jag vill jämföra med ett annat.
    Det är samma enheter som svarat på samma frågor vid två olika tillfällen. Jag ska undersöka eventuella förändringar mellan de båda undersökningstillfällena. Ska enheterna kodas så att de är samma i båda dataseten och frågorna särskiljas eller ska kodning för både enheter och frågor vara identiska i de båda dataseten?

  55. Hej! Jag undrar hur en variabel kan gå från minus (negativa värden) till plus (positiva
    värden)? Det är väl inte möjligt att begå t.ex. minus antal våldsbrott?

    • Hej Chris, nej det beror givetvis på vad det är för variabel. Antal kan ju inte vara negativa, men grader celsius kan ju tex vara negativ. Det beror helt på.

      /Anders

  56. Det är en jämförelse mellan tre länder där den beroende variabeln är brott och de oberoende är bla religion, socioekonomisk status, tidigare brottslighet m.m…. alla variabler heter någonting med scale… och så i tabellen som heter ”descriptive statistics for variabels used in the analysis” så står det tex på religion att skalan på värdena i land A går mellan -1,97- 2,49….. Jag förstår inte riktigt varför de är minus.

  57. Hejsan. Jag håller på att göra en logit regresssion i SPss och har några funderingar.
    1) Jag ämnar att testa flera variabler som inte är diakotoma och om jag förstår det rätt måsta jag då gå in under categorical. Hur gör man om man har flera sådana variabler? Kan man lägga in alla där? Ska man klicka i rutan first or last?
    2) Är det en bra tanke att testa alla variabler enskild innan man prövar dem tillsammans? Vi får nämligen en bättre signifikansnivå med en multivariat logitmodell då vi ej förkastar förkastar variabler från den univariata prövningen.

    Stort tack på förhand.

  58. Hej Anders,

    Tack för en mycket bra blogg! Jag har en kort fråga angående en linjär regressionsanalys, och hur man får fram ett Durbin-Watson värde om man har använt funktionen ”weight cases” i SPSS? Vi får ett felmeddelande där det står ”Not computed because fractional case weights have been found for the variable specified on the WEIGHT command”.

    Stort tack,
    Eva

  59. Hej Anders!

    Jag undrar om man kan undersöka kvantitativa variabler på intervall och kvotskalenivå (Oberoende och beroende variabler) i en korstabell? Eller är det helst och endast kvalitativa variabler (nominal och ordinalskalenivå) som gäller i korstabell?

    Tacksam för svar!

  60. Hej Anders,

    Vi ska göra en undersökning av länder som använder sig av proportionella valsystem med antingen closed/open list och om detta har någon påverkan på kvinnlig representation i parlamentet. Vi undrar hur vi ska gå till väga för att göra denna sortens undersökning.

    Tacksam för svar.

  61. Hej, hur kan man på smidigaste sätt gruppera variabler? Alltså så att alla frågor som ska mäta en viss grej hamnar tillsammans? Tacksam för svar. Mvh Bodil

  62. Hej. Jag undrar om man får approximera ordinaldata. Om patienter upplever grad 0, 1, 2 eller 3 biverkningar efter en viss behandling, får jag då räkna medelvärden och säga att en viss grupp fick tex 1,3 i biverkningsgrad och en annan grupp 2,2? Tack för hjälpen! Hälsningar
    Johanna

  63. Hej, tack för en jättebra guide. Jag har ett problem. Vi har gjort en enkätundersökning och vi har gjort en ”befolkningspyramid” som ska visa på åldersfördelning och kön på respondenterna, alltså kvinnor har en ålderspyramid åt ena hållet och män åt det andra. Jag skulle vilja göra en sån motsvarande för hela population som består av nästan 4000 individer. Jag har en tabell som säger hur många kvinnor och män som är i varje åldersgrupp (grupper om 10 år). Den indelningen är densamma som jag har använt för respondenterna. Så min fråga är hur kan jag göra en pyramid av en färdig tabell?

    Tacksam för ett snabbt svar då uppsatsen ska in nästa vecka.

    Mvh Boddil Pettersson

  64. Hej!
    Jag vill undersöka vilken effekt en treårig utveckling i nutritionsstaus har på antalet sjukhusdagar under samma tidsperiod. Har gjort parvisa observationer och beräknat förändringen. Högt nutritionsvärde (= bättre nutrition) vid baslinjen och ett lägre värde vid uppföljningen innebär att nutritionen försämrats. Ett försämrat nutritionstatus ger alltså positiva tal, ett oförändrat nutritionsstatus ger värdet noll och ett förbättrat nutritionsstatus ger negativa tal.
    Kan jag använda förändringen som den är, dvs med både positiva och negativa tal i en linjär regression?

    MVH
    Suzana

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s