Guide: Jämföra medelvärden och t-test

Anders Sundell Guider, Tabellanalys september 24, 2010november 29, 2016 4 minuter

I det här inlägget ska vi:

Gå igenom hur man jämför medelvärden mellan olika grupper.
Signifikanstesta skillnaderna mellan grupperna med hjälp av t-test.

Längst ned i inlägget finns en videoguide.

En av de vanligaste analyserna man gör när man analyserar statistiska data är att undersöka om medelvärden på en variabel skiljer sig mellan två eller flera olika grupper. I SPSS gör man det väldigt enkelt genom vektyget ”Compare Means”.

I det här exemplet ska vi använda oss av en datamängd som innehåller valnattsresultaten i det svenska riksdagsvalet 2010 i varje svensk kommun, tillsammans med ett antal socioekonomiska variabler för kommunen som har hämtats från SCB.se. Datamängden kan laddas ner härifrån.

Sambandet vi ska undersöka är huruvida det finns ett samband mellan en kommuns befolkningsstorlek och andelen blankröster i kommunen. Det vi gör då är att gå in på ”Analyze–>Compare Means–>Means”.

Bild 1. Hur man hittar compare means i SPSS.

När man klickat på ”Means” får man upp en ruta som ser ut som i bild 2. I rutan ”Dependent list” klickar man in sin beroende variabel. I rutan ”Independent list” klickar man in sin oberoende variabel. Den beroende variabeln ska vara en intervallskala, medan den oberoende variabeln kan vara både en ordinalskala och en nominalskala. Tryck sedan på OK.

Bild 2. Hur man väljer beroende och oberoende variabel.

Du får ut output som ser ut som i bild 3. Det intressanta är tabellen ”Report”. Där står kategorierna i din oberoende variabel listade, i det här fallet de tre värdena på befolkningsvariabeln, ”Låg”, ”Medel” och ”Hög” befolkning tillsammans med ett totalvärde. Till höger om namnet på kategorin står medelvärdet för analysenheterna i den kategorin. Vi kan här se att andelen som röstade blankt i små kommuner var 1,31 procent, i medelstora kommuner 1,25 procent och i stora kommuner 1,07 procent. Det verkar alltså som att vi kan besvara vår fråga jakande: befolkningsstorlek verkar påverka benägenheten att rösta blankt i riksdagsvalet.

Bild 3. Hur man tolkar outputen.

T-test

Undersökningen vi har gjort här är en totalundersökning, eftersom alla 290 svenska kommuner ingår i urvalet. De skillnader vi är intresserade att uttala oss om finns alltså beräknade i analysen. Det är dock ofta vanligt att man gör urval från större populationer. Vi kan till exempel tänka oss att vi gjort den här analysen bland Frankrikes 36781 kommuner (de har så många!). Då hade vi antagligen inte kunnat undersöka alla kommuner, utan hade fått göra ett slumpmässigt urval bland kommunerna. Låt oss säga att vi hittade den skillnaden som vi nu har uppmätt. Beror den skillnaden i vårt urval på att vi råkat få tag i några små kommuner med hög andel blankröster och några stora kommuner med hög andel blankröster, trots att det inte är en genomgående trend? För att svara på den frågan behöver vi signifikanstesta medelvärdesskillnaden. Ett signifikanstest kan avgöra om vår skillnad beror på slump i urvalet, eller om den kan förväntas gå igenom i hela populationen (alla Frankrikes kommuner).

Vi går då in på ”Analyze–>Compare Means–>Independent samples t-test”.

Bild 4. Hur man hittar t-test.

Efter att man valt ska det komma upp en ruta som ser ut som i bild 5. I rutan ”Test variables” klickar man i sin beroende variabel. I rutan ”Grouping variable” klickar man i sin oberoende variabel.

Bild 5. Hur man väljer beroende och oberoende variabel.

T-testet är till för att testa om skillnaden mellan två grupper är signifikant, så efter att man klickat i den oberoende variabeln ska man trycka på knappen ”Define groups”. I rutan som kommer upp skriver man i namnet på de två grupper man vill jämföra. Vill här jämföra ytterpunkterna på skalan – finns det en signifikant skillnad mellan kommuner med ”Låg” befolkning (värde 1) och ”Hög” befolkning (värde 3)? När man valt grupp 1 och 3 trycker man på OK. Outputen visas i bild 6.

Bild 6. Output från t-test.

I rutan ”Group statistics” får vi ut lite beskrivande statistik, som medelvärdet i varje grupp (som känns igen från Bild 3). Det intressanta är i rutan ”Independent samples t-test”. Det första vi gör är att titta i kolumnen för ”Levene’s test for equality of variances”. En förutsättning för att vi ska kunna signifikanstesta skillnaderna mellan grupperna är att spridningen inom grupperna är densamma. Det är det Levene’s test visar. Ett Sig-värde som är under ,050 betyder att spridningen inte är densamma. Då får man titta i raden ”Equal variances not assumed”. Om sig-värdet är högre än ,050 kan vi utgå ifrån att spridningen är densamma, och kollar då på raden ”Equal variances assumed”.

I det här fallet blir Levene’s test signifikant, och vi får därför titta i raden ”Equal variances not assumed”. Vi går sedan till kolumnen ”Sig. (2-tailed)” som testar om medelvärdesskillnaden som beskrivs i kolumnen ”Mean difference” är signifikant. Om värdet är under ,050 är skillnaden signifikant med 95 procents säkerhet. Det vill säga, skillnaden vi hittat i vårt slumpmässiga urval återfinns med 95 procents säkerhet också i den större populationen. Så är fallet nu, vilket innebär att skillnaden i andelen blankröster i små och stora kommuner är signifikant.

Uppdatering 2012-04-18: En förklaring till varför man två medelvärden kan vara signifikant skilda, trots att de har överlappande konfidensintervall finns nu här.

Uppdatering 2012-10-31: En guide till hur man jämför ett medelvärde i en grupp med ett på förhand definierat värde, ”one sample t-test” finns nu här.

Videoguide: Jämföra medelvärden och t-test

Publicerad av Anders Sundell

Visa alla inlägg av Anders Sundell

Publicerat september 24, 2010november 29, 2016

77 reaktioner till “Guide: Jämföra medelvärden och t-test”

Shahla skriver:

januari 16, 2011 kl. 12:58

hej Anders,
Hur kan jag göra om jag har en nollhypotes exempelvis medelvikt 2010 74kg och vill jämför med medelvikt för 20 sedan dvs 1990.
Hur räknar jag t-värde?
mvh
Shahla

Svara
1. Anders Sundell skriver:
  
  januari 21, 2011 kl. 13:47
  
  Hej, är det så att du har en datamängd för 2010, och vill jämföra om medelvikten är signifikant skild från ett annat värde?
  
  Då går du in på analyze–>compare means–>one sample t-test.
  
  Sen klickar du i din viktvariabel och skriver i rutan ”test value” i det värde du vill testa emot, dvs medelvikten 1990. I tabellen kan du sedan i kolumnen ”Sig” se om skillnaden i medelvärden är signifikant.
  
  /Anders
  
  Svara
Helen skriver:

februari 20, 2011 kl. 11:08

hej

jag har gjort en faktoranalys och därmed fått 4 faktorer som jag har gjort t-test på, alltså 4 t-test. på två av dessa faktorer har jag värdena p= .001, .006 de andra 2 faktorer har värdena p= .118, .508. med signifikansnivå på 0,05 . vad säger detta mig och hur skriver jag det i ord i en artikel??

Mvh Helen

Svara
1. Anders Sundell skriver:
  
  februari 23, 2011 kl. 13:40
  
  Hej Helen!
  Jag hade lite svårt att förstå din fråga och har därför rådfrågat bekanta som kan mycket mer om faktoranalys. I vanlig faktoranalys så signifikanstestar man inte faktorerna.
  
  Är det så att du har testat om två grupper skiljer sig åt med avseende på medelvärdena på de fyra faktorerna? Om det är så så säger resultaten dig att för två av de fyra faktorerna har de två grupperna medelvärden som med 95 procents säkerhet är skilda från varandra i den större populationen. För de två andra faktorerna är skillnaden i medelvärde inte statistiskt signifikant.
  
  Var det så du menade? Om inte, förtydliga gärna vad exakt det är du gjort.
  
  /Anders
  
  Svara
Ola skriver:

mars 1, 2011 kl. 09:03

Hur gör jag om jag vill räkna ut ett konfidensintervall One-Sample T-test för proportioner ? Hur skapar men en ny variabel som här värdet 0/1 så att det ska vara möjligt att utföra beräkningen ?
Mvh Ola

Svara
1. Anders Sundell skriver:
  
  mars 4, 2011 kl. 15:03
  
  Hej Ola!
  Du får helt enkelt koda om din variabel till en ny variabel som är 0 och 1.
  https://spssakuten.wordpress.com/2010/01/10/omkodning-av-variabler/
  Om du har en kontinuerlig variabel, till exempel från 0-100, och du vill se hur stor andel som har över 50, så använder du fältet ”Range” i omkodningsfönstret. Du kan då säga att 0-50 ska bli till nollor i den nya variabeln, och 51-100 ska bli 1. Då kan du sedan få fram konfidensintervallet för proportionen. Var det så du menade?
  
  /Anders
  
  Svara
Eva Olausson skriver:

september 1, 2011 kl. 16:13

Hur gör man rent praktiskt ett linjediagram?
Hur gör man ett linjediagram baserat på medelvärden och SD ELLER SE?

Svara
Anonym skriver:

oktober 4, 2011 kl. 13:09

Hej!
Lite utanför ämnet men det handlar om att signifikanstesta skillnader, dock mellan två korrelationskoefficienter. Jag har två intraklasskorrelationer som anger samstämmighet i bedömningar av barn med ADHD, jag vill jämföra korrelationen för samstämmighet i skattningar mellan lärare och föräldrar när de skattar flickor (Korrelation 1) med korrelationen för samstämmighet i skattningar mellan lärare och föräldrar när de skattar pojkar (krrelation 2). Jag har alltså två ICC-korrelationer och konfidensintervall. Hur gör jag för att signifikanstesta skillnaden mellan dessa?
Tacksam för svar!
Ina

Svara
1. Anders Sundell skriver:
  
  oktober 4, 2011 kl. 13:19
  
  Hej Ina!
  Det allra enklaste är att se om konfidensintervallen överlappar eller ej. Om konfidensintervallen inte överlappar så kan du vara säker på att korrelationerna är signifikant skilda.
  
  Och om det ena konfidensintervallet överlappar det andra punktvärdet, alltså den uppskattade korrelationen, kan du också vara säker på att skillnaden mellan korrelationerna inte är signifikant – det ena kan ju lika gärna vara det andra, eftersom konfidensintervallet täcker in det andra värdet.
  
  Den lurigaste situationen är om konfidensintervallen överlappar, utan att täcka in skattningarna för korrelationerna. Då måste man ta till mer avancerade tester. För att signifikanstesta skillnader mellan vanliga korrelationer kan man använda sig av Fisher’s Z, läs mer om det här:
  
  http://davidmlane.com/hyperstat/A50760.html
  
  VIlket test man ska använda beror dock på samplingsdistributionen, och jag vet faktiskt inte hur den ser ut för intraklasskorrelationskoefficienter. I den här artikeln diskuterar man avancerade metoder för att testa koefficienterna, men vad jag förstod så kommer de inte fram till något definitivt svar.
  
  http://www.google.com/url?sa=t&source=web&cd=1&ved=0CBwQFjAA&url=http%3A%2F%2Fwww.nesug.org%2Fproceedings%2Fnesug07%2Fsa%2Fsa13.pdf&rct=j&q=significance%20test%20intraclass%20correlation%20coefficient&ei=EvmKTtnlO8yB4ATouOSWBA&usg=AFQjCNEKgOa3TVKMZUD0mEBlbvWBkBIcYA&sig2=jQrcO4M8cQ2shvjFvcZJFQ&cad=rja
  
  Det är tyvärr det bästa svar jag har, men någon läsare vet kanske mer?
  /Anders
  
  Svara
  1. Anonym skriver:
    
    oktober 4, 2011 kl. 13:31
    
    Tack så hemskt mycket för snabbt svar!
    
    Du skriver: ”Den lurigaste situationen är om konfidensintervallen överlappar, utan att täcka in skattningarna för korrelationerna. Då måste man ta till mer avancerade tester.” Det är ju så klart precis så det är med mina data… Ska ge mig på och titta på länkarna som du gett.
    
    Och visst menar du att ”om konfidensintervallen överlappar kan du vara säker på att korrelationerna INTE är signifikant skilda”.
    
    Tack igen, det är fantastiskt att du finns! : )
  2. Anders Sundell skriver:
    
    oktober 4, 2011 kl. 13:36
    
    Hej igen, jag skrev fel, tack för att du påpekade. Det jag menade var givetvis ”om konfidensintervallen INTE överlappar kan du vara säker på att korrelationerna är signifikant skilda”.
    
    /Anders
andreas skriver:

november 7, 2011 kl. 09:39

Hej! Hur vanligt är det att man går vidare med tolkning av en tvåvägs variansanalys när levenes test blir signifikant? Om man ska jämföra skillnader inom en grupp exempelvis hitta ett samband mellan lön och ålder med åldersskillnaderna inte är tillräckligt stora.

Svara
D skriver:

december 20, 2011 kl. 19:10

Hej Anders! Och tack för all hjälp jag redan fått!

Har skummat områdena, men står fortfarande med stora frågetecken. Har lyckats göra signifikanstest på en mängd variabler som jag nu vill åskådliggöra mha en tydlig graf/diagram.

Finns det någon enkel funktion för detta från T-testet – Ute efter ngn scattervariant med båda kurvorna och pvärde ovanför eller inbakat i diagrammet. Har du tid att svara skulle det vara en fin julklapp.

tack på förhand /D

Svara
Anonym skriver:

december 21, 2011 kl. 13:15

Hej!

Är det möjligt att utföra ett T-test, om man har en grupp och vill jämföra två variabler?

Svara
1. Anders Sundell skriver:
  
  december 28, 2011 kl. 00:40
  
  Då gör man såhär:
  https://spssakuten.wordpress.com/2011/10/27/lasarfraga-jamfora-medelvarden-pa-tva-variabler/
  
  /Anders
  
  Svara
lora skriver:

mars 14, 2012 kl. 00:14

jag vill göra en studie av sjuåriga pojkars vikt i två olika länder fått följande resultat:
Land A: 32, 30, 28, 33, 34, 35, 29
Land B: 26, 27, 28.5, 27.5, 29.5, 26.5
hur kan jag testa nollhypotesen att medelvärdet av vikterna är detsamma och standardavvikelsen är okänd
hur gör jag att använda t test

Svara
lora skriver:

mars 14, 2012 kl. 00:15

och kan jag räkna det i papper eller måste använda datan för att lösa den tack

Svara
1. Anders Sundell skriver:
  
  mars 14, 2012 kl. 20:32
  
  Hej Iora!
  Du kan rakna det for hand (gör en googling pa t-test sa hittar du hur du kan gora) men du kan ocksa lagga in det i SPSS och gora det enkelt med hjalp av ett t-test som jag beskriver i guiden har. Det finns en annan guide har pa bloggen som visar hur man gor for att lagga in data i SPSS. Lycka till!
  
  /Anders
  
  Svara
M skriver:

mars 26, 2012 kl. 23:28

Hej Anders!

Det är såhär att jag håller på med en validering inom distal tryckmätning. Det finns två olika mätinstrument som kan användas för att mäta blodtrycket på patienterna. Jag håller på att jämföra om de ger samma resultat och vill alltså undersöka om skillnaden är signifikant eller inte (vill använda ett t-test). Först mättes blodtrycket med det första instrumentet och sen med det andra. Jag vet inte hur jag ska sammanställa det i SPSS, kan alltså inget om SPSS men vill gärna att du beskriver utförligt så jag kan göra det i programmet, hade verkligen varit jättesnällt av dig! Din hjälp kan leda till att kvaliten på undersökningen förbättras.

Svara
1. Anders Sundell skriver:
  
  mars 27, 2012 kl. 10:19
  
  Hej M!
  Jag har beskrivit hur man matar in data och sätter ihop en datamängd här:
  https://spssakuten.wordpress.com/2011/12/19/guide-mata-in-data-och-bygga-en-datamangd/
  
  Tillsammans med den här guiden om t-test borde det gå bra.
  Lycka till!
  
  /Anders
  
  Svara
emma skriver:

mars 28, 2012 kl. 11:41

Hej Anders!
Stort tack för intressant läsning och hjälp i SPSS-djungeln!
Jag har några frågor om t-test independent sample som jag hoppas att du kan hjälpa mig med.
I min uppsats jämför jag två grupper, en ”normgrupp” med 300 deltagare och en ”klinisk grupp” med 30 deltagare på ett antal variabler. Till detta har jag valt t-test för oberoende medelvärde, men undrar om datan uppfyller kraven för det, bla eftersom grupperna ju är väldigt olika stora.
Min första fråga är om man kan jämföra en grupp på 30 individer med en grupp på 300 individer? I det mindre stickprovet är variablerna normalfördelade, men inte i det stora.
Sedan undrar jag om man kan lita på resultaten från ett t-test även om ett stickprov på 300 deltagare får signifikanta värden vid Test of normality (Shapiro Wilk) alltså ej är normalfördelat, pga stickprovets storlek?
Utifrån detta undrar jag om du tycker att det går att använda t-test eller om jag måste välja icke-parametriska alternativ, såsom Mann-Whitney?
Tusen tack på förhand!
/Emma

Svara
1. Anders Sundell skriver:
  
  mars 30, 2012 kl. 11:58
  
  Hej Emma!
  Den olika storleken på grupperna bör (tror jag) inte i sig vara ett problem. Det viktiga är att variansen är ungefär densamma i grupperna.
  
  Som jag har skrivit tidigare här på bloggen så är ickeparametrisk statistik en av mina svaga sidor, men jag skulle kollat på fördelnignarna med hjälp av histogram. Om de är väldigt ickenormala så kan nog något ickeparametriskt test vara bättre, men om det bara är en liten avvikelse kan nog t-testet funka.
  
  Ett (inte så sofistiskerat) alternativ är att testa båda metoderna. Om de ger samma resultat kan du ju känna dig lugn. Det luriga är om de ger olika resultat. I det fallet skulle jag gå på det ickeparametriska testet.
  
  /Anders
  
  Svara
Nils skriver:

april 18, 2012 kl. 13:29

Hej, Denna fråga är kanske förklarad tidigare i denna tråd men jag känner jag vill ha lite mer klarhet.

Jag har data på temperaturen i två grupper som jag vill se om de är signifikant skilda från varandra. Jag har beräknat ett konfidensintervall (95%) och det överlappar. När jag gör ett t-test ger det dock att <0,05 dvs att det medelvärdena är signifikant skilda från varandra. Bör det inte ge samma sak dvs att de ej överlappar och t-test < 0,05. Eller har kan jag ha gjort något fel? Kan det bero på att jag har få observationer i mina grupper (ca 10st)?

Svara
1. Anders Sundell skriver:
  
  april 18, 2012 kl. 16:41
  
  Hej Nils!
  Nu har jag svarat på din fråga här:
  https://spssakuten.wordpress.com/2012/04/18/lasarfraga-overlappande-konfidensintervall/
  
  /Anders
  
  Svara
Anonym skriver:

maj 9, 2012 kl. 18:58

Hej! Jag behöver hjälp med vad och hur jag ska göra med min data insamling. har två oberoende variabler ; arbetslös och ej arbetslös. Två beroende variabler : hälsa och välbefinnande. Vill se hur dessa två oberoende variabler påverkar de beroende variablerna.Vore tacksam om någon har tid och lust att förklara vad jag ska göra. tack

Svara
Anonym skriver:

maj 10, 2012 kl. 23:17

Hej Anders!

Kan du rekomendera en säker källa där man kan ladda ner och använda SPSS programet gratis i några dagar? Finns så många konstiga sidor på nätet, så det är alltid bra att bli rekomenderad till en som inte har några konstigheter och som dessutom är helt laglig.

Tack på förhand!

Svara
Sara&Nahal skriver:

november 15, 2012 kl. 11:17

Hej Anders! Om man vill jämföra en och samma grupp vid två olika tillfällen? Det är en beroende t test som ska utföras. Vad går man in på då? Är det One sample t test eller paired sample t test ?? Tacksam för svar snarast :/

Svara
Sara&Nahal skriver:

november 15, 2012 kl. 12:34

Vem som helst kan svara oss vi behöver AKUT HJÄLP!

Svara
Helena skriver:

november 20, 2012 kl. 15:04

hej!
Jag ska göra ett paired t-test för en och samma grupp som gjort skattningar på två olika test. Villkoren för ett paired t-test är ju att differenserna ska vara normalfördelade. Hur kontrollerar jag det? Ska jag titta på differenserna i skattningarna för test A och test B var för sig eller på differensen mellan test A och B?
Tacksam för hjälp!

Svara
1. Anders Sundell skriver:
  
  november 27, 2012 kl. 09:29
  
  Hej!
  Du kan med hjälp av transform->compute ta fram differensen mellan resultatet på test A och test B och sedan ta fram ett histogram på de differenserna. Men villkoret för t-testet är som jag förstår det att differenserna ska vara normalfördelade i populationen, inte i ditt urval, och det går ju inte att testa. Det får man bara göra ett antagande om.
  
  /Anders
  
  Svara
Ewa Ericsson skriver:

november 26, 2012 kl. 19:16

Jag har gjort en one sample t-test där jag via en enkät låtit 45 deltagare ange vikt, längd och ålder på en person de sett en kort tid. Har efter uträkning och redovisning fått svar att:
Jag skall ange var figurtext är figurtext och där resultat sektionen innehåller de element som ska finnas där. Dessutom saknas effektstorlekar och formalia för rapportering av statistik är bristfällig.
Jag har angett som exempel: T-test för undersökning av stickprovsmedelvärde som utfördes visade att den skattade åldern (m=31,33 sd=6,432) var signifikant lägre än 35 år, t(43)= -3,79, p<0,05. Se tabell 2. Utifrån de inlämnade svarsformulären kunde man utläsa att åldern skattats till 30 år och ej till den verkliga åldern av 35 år. Vart ligger felet. Jag har också med en tabell som visar utslaget.

Svara
Daniel skriver:

december 12, 2012 kl. 14:02

Hej!
Tack för Ditt/Ert engagemang! Ni är ovärdelig hjälp för mången forskare! Mer en SPSS fråga än statistisk: Jag har ett material med fall och kontroller, vem som är vad beskrivs under en dikotom variabel. Utöver denna har jag en massa andra variabler. När jag vill beskriva mitt material så vill jag bla ta ut medelvärden skilt mellan fall och kontroller. Jag undrar då om man kan använda en funktion typ ”Analyze-Descriptives” men med tillägget att fall-kontrollvariabeln är 1 rep 0? Eller måste jag gå omvägen att omkoda till nya variabler för varje variabel och fall/kontroll? Kan inte se att jag kan få ut medelvärden i ”crosstabs”, vilket skulle kunna vara en väg.
Mvh

Svara
1. Anders Sundell skriver:
  
  december 12, 2012 kl. 22:05
  
  Hej Daniel!
  Använd Analyze->Compare means->Means så tror jag att du ska få ut det du vill.
  
  /Anders
  
  Svara
Adam skriver:

december 17, 2012 kl. 14:47

Hej!
Jag håller på med en studie som handlar om vinstmanipulering.

Här ska jag jämföra 2 populationer, ena med företag som har bytt VD och andra företag som ej har bytt VD.

Antalet som har bytt VD är 25 stycken och som inte har bytt VD är 131 stycken.

Talen i fråga är olika storlekar på ”vinstmanipulering” i form av decimaltal. Alltså för VD-byten 25 stycken tal och för de som ej bytt VD 131 stycken tal.

Mina hypoteser är:
H0: Det finns ett samband mellan VD-byte och vinstmanipulering
H1: Det finns ej ett samband mellan VD-byte och vinstmanipulering

Jag skulle vara ytters tacksam om du svarade på hur jag ska gå tillväga i SPSS.

MVH / Adam

Svara
1. Statistik skriver:
  
  januari 21, 2013 kl. 15:31
  
  T-test för oberoende.
  Du kan höra av dig på statistik112@hotmail.com om du har fler frågor.
  
  Svara
Viktoria skriver:

december 17, 2012 kl. 15:46

Hejsan,

jag skriver en uppsats i Kriminologi och i den måste ett SPSS test presenteras. Min fråga är vad som är det bästa statistiska testet i mitt fall om man vill se om antal anmälda brott har minskat efter en klottervägg blivit upprättad. Min statistik består av antalet anmälda före klotterväggen och efter. Väggen sattes upp i juni 2012 så jag vill jämföra antalet anmälda brott tre månader efter väggen sattes upp med antalet anmälda brott samma tre månader fast året innan.

Hur ska jag gå tillväga?

Tack på förhand,
Viktoria

Svara
1. Statistik skriver:
  
  januari 21, 2013 kl. 15:30
  
  Utifrån din beskrivning verkar t-test vara det mest lämpliga. Du kan höra av dig på statistik112@hotmail.com om du har fler frågor.
  
  Svara
Michaela skriver:

december 22, 2012 kl. 10:43

Jag vill göra ett beroende t-test per försöksperson för att se vilken könsroll personen har, dvs. om denne skiljer sig signifikant mellan maskulin/feminin. Hur delar man upp så att det blir en hypotesprövning per person och inte för hela data?

Tacksam för svar
Michaela

Svara
1. Anders Sundell skriver:
  
  december 22, 2012 kl. 17:31
  
  Hej Michaela,
  alla statistiska test görs på en mängd, inte på enskilda personer. Jag tror inte man kan göra riktigt det du beskriver. Däremot kan man till exempel undersöka om det är så att vissa grupper är signifikant mer maskulina/feminina än andra grupper.
  
  /Anders
  
  Svara
  1. Anonym skriver:
    
    december 22, 2012 kl. 18:40
    
    Jag använder en skala som använts i många undersökningar, dvs, BEM sex-role inventory. I de studier som använt skalan så gör dem ett t-test för att få fram individens könsroll. Man jämför då medelvärdena för maskulin respektive feminina poäng för varje individ, och ser då om det finns en signifikant skillnad. Ingenstans hittar jag dock hur exakt de utfört detta, finns det något annat alternativ jag kan göra detta på?
Anonym skriver:

december 22, 2012 kl. 12:31

Hej!
Jag har också ett test som har ett Sig. värde under 0,05, men du nämner inte alls att man kan kolla på frihetsgrader-tabellen för t-test. Behövs inte det då för att avgöra om man kan förkasta nollhypotesen eller ej?
Tacksam för snabbt svar!
N

Svara
1. Anders Sundell skriver:
  
  december 22, 2012 kl. 17:29
  
  Hej, nej det behöver man inte. Frihetsgraderna och tabellen behöver man kolla på om man bara har t-värdet. SPSS gör det automatiskt och tar utifrån det fram signifikansvärdet. Är det under 0,05 så betyder det att t-värdet översteg det kritiska värdet.
  
  /Anders
  
  Svara
Charlotte Malmgren skriver:

mars 4, 2013 kl. 09:04

Hej & tack så mycket för ert svar på min förra fråga!

Jag har en fundering kring tolkningen av resultatet då jag gjort t-test (samt ibland Whitney U Test).

Jag jämför två urval av företag och dess förändring i energiförbrukning innan certifiering av ISO 14001, (år 1994-2000), och efter certifiering (år 2000-2006). Min nollhypotes är att det inte är någon skillnad i energiförbrukning före certifiering jmf med efter certifiering. Här nedan följer lite info fr en av beräkningarrna:

n=15 (ant företag)
Medelv.= -48
Kurtos=14
Skevhet -3,76

n=15
Medelv.= -12
Kurtos=0,8
Skevhet= -1,4

Min fråga 1) Ska jag ta bort en uteliggare här för att kunna anta att det är normalfördelat och sedan köra t-test, (i och med att kurtosen och skevheten i ena företagsgruppen inte ligger inom intervallet -2 till +2), eller ska jag göra Mann Whitney U test på en gång?

Resultat fr Mann Whitney U testet blir Sig.= 0,744 Retain the null hypothesis.

Resultat fr t-test, (efter det att en uteliggare tagits bort), blir:
Sig.=0,029 –> equal variances not assumed.–> Läs på den nedre raden i tabellen.

Sig. (2-tailed)= 0,129 –> Min fråga 2) Säger man att skillnaden vi hittat i vårt slumpmässiga urval inte återfinns med 95% säkerhet i den större populationen. Eller tar man hänsyn till själva värdet 0,129 och säger exempelvis att skillnaden inte återfinns med 12,9% eller med 87,1% säkerhet.

t-värdet= 1,588; Min fråga 3) Vad säger t-värdet och hur använder man det? Jag trodde att man jämför detta värde med ett tabellvärde och om det är mindre än tabellvärdet så kan man förkasta nollhypotesen. Stämmer detta?

I detta fall blir tabellvärdet (df=19,221) = 1,728 vilket är > 1,588. Vilket skulle innebära att vi kan förkasta nollypotesen.

Men jag förstår inte hur detta går ihop med Sig. (2-tailed värdet) som säger att skillnaden som vi hittat i vårt slumpmässiga urval inte återfinns i den större populationen med x% säkerhet?

Vänlig hälsning Charlotte

Svara
1. helpspss skriver:
  
  mars 4, 2013 kl. 10:45
  
  1. Man ska ha goda skäl till att avlägsna en observation bara för att det inte uppfyller antagandet om normalfördelning. Om det rör sig om rena inmatningsfel, mätfel etc. så ska man avlägsna observationer, annars aldrig.
  Om man har outliers som man kan ”förklara” bör man istället utgå från icke-parametriska test, typ Mann-Whitney.
  
  2. Sig. (2-tailed)= 0,129 betyder att det är 12.9 % sannolikt att det resultat du fått uppkommit av ren slump.
  
  3. T-värdet kan enklast förklaras av det är en kvot mellan förklarad respektive oförklarad varians (skräp som inte fångas av modellen. Ju större (i abosluta) belopp t-kvoten är desto mer förklarad varians har vi i modellen.
  Du behöver aldrig kolla på t-kvoten och slå i t-tabeller. Du har all information om signifikans/icke-signifikans när du kollar på p-värdet.
  
  Svara
Ida skriver:

maj 5, 2013 kl. 13:34

Hej!

Jag undrar om t-test är en lämplig metod i mitt fall: Jag ska testa om det finns några skillnader mellan iPhone-avnändare och Android-användare när det kommer till varför de valde just den mobiltelefonen de har. Om det är funktion, känslor eller sociala faktorer som påverkade valet. Datan jag kommer få in är via en enkätundersökning där deltagarna först får svara om de har en iPhone eller en Android. Resten av frågorna är 1-7 (1= Instämmer inte alls, 7 = Instämmer helt och hållet) som ställs för att avslöja om det är funktion, känslor eller sociala faktorer som påverkat köpet. Räcker det då med ett t-est och jämföra mellan de två olika grupperna hur svaren skiljer sig åt eller bör man ställa upp hypoteser och genomföra exempelvis ett chi-test istället?

Tacksam för hjälp och svar!

MvH Ida

Svara
Christina skriver:

juni 16, 2013 kl. 08:15

Hej,
Jag har ett material som består av 851 personer. Det finns en grupp som angivit att de inte har goda kunskaper i ett visst ämne (ca50st), jag skulle vilja jämföra.om det finns en signifikans mellan de som svarat att de inte anser att de är lämpade för uppgiften.
Svarsalternativ, ordinalskala från Totally agree-partially agree, Partially Disagree till Disagree. Vilket test använder jag lämpligen? Tack på förhand!

Svara
anna skriver:

juni 16, 2013 kl. 12:44

du kommer nog inte att få svar på din fråga här. jag har fått hjälp av http://spssstatistik.wordpress.com/2013/03/06/erbjuder-hjalp-med-statistisk-analys-och-spss-3/

Svara
Sophie skriver:

juli 11, 2013 kl. 21:23

Hej!
jag har gjort en studie där halt av ett visst protein mäts före och efter medicinering med viss substans. Går det att göra ett one-sample t-test och välja koncentration före och efter medicinering som variabel och välja test-värde:0? Jag får P-värde: 0,000 vad har jag gjort tokigt?

Svara
Meriam skriver:

september 21, 2013 kl. 10:58

Hej!
Jag undrar ifall t-test är lämplig för följande fall
Diskutera nollhypotes (Null Hypothesis) och dess betydelse för hur du prövar din hypotes i praktiken. Min oberonde variabel är alkolholrelaterade dödligheter och beroende variabel är bistånsdtagarna, arbetslöshet och skilsmässa!!!

Mvh

Svara
1. Anonym skriver:
  
  september 21, 2013 kl. 14:25
  
  jag tror att du förväxlat betydelsen av beroende/oberoende variabler. enligt ditt resonerande skulle exempelvis skilsmässa bero på alkoholrelaterad dödlighet, arbetslöshet beror på alkoholrelaterad dödlighet. känns inte logiskt.
  desto viktigare är följande…utan att veta vilken skalnivå dina variabler ligger på kan man omöjligt besvara din fråga.
  
  Svara
Gunilla skriver:

december 13, 2013 kl. 11:30

Hej!
Vi har gjort en studie där vi har 6 personer vars svar vi enskilt vill jämföra mot en grupp på 20 personer. Vi vill alltså jämföra en av de 6 personernas svar mot medelvärdet hos de andra 20. Svaren har angetts på en likert skala 1-5.
Kan vi använda T-test då vi bara har ett medelvärde mot ett faktiskt värde?
Vad använder vi annars för att mäta om skillnaderna mellan gruppen och den enskildes svar har ett signifikansvärde?

Svara
Alex skriver:

december 19, 2013 kl. 22:52

Hejsan,

Jag behöver hjälp med veta vilken typ av test jag ska använda.

Jag har data för två år, 06 & 07 som jag vill jämföra med varandra för att se ifall det finns en skillnad mellan dessa åren. Hur gör jag lättast?

Tack på förhand!

Svara
AM skriver:

februari 9, 2014 kl. 12:12

kan nån hjälpa mig med den här fråga:
1.Tänk dig att du ska analysera resultatet av en undersökning med experimentell design (en experimentgrupp och en kontrollgrupp) med en mätning i efterhand. Den beroende variabeln är approximativt normalfördelad och utgörs av självskattad hälsa med skalstegen (a) urdålig, (b) ganska dålig, (c) någorlunda, (d) ganska bra, och (e) toppenbra. Tala om vilket statistiskt test (analys) du anser är lämpligast att använda och diskutera ingående de viktigaste aspekterna som du grundar ditt val på

Svara
DH skriver:

april 22, 2014 kl. 09:39

Hej!
Tack för din ovärdeliga och mycket infomativa sida! Jag har en fråga kring felsökningar och hur Du tänker. Jag sitter och signifikansprövar ett material. I det specifika problemet har jag två dikotoma varabler. En med personer i en studie (deltar = 1 och deltar ej = 2) samt en med utbildningsnivå hos personerna (utb över grundskola =1, enbart grundskola =2). När jag kör en Chi-2 analys får jag signifikant skillnad mellan grupperna (p=0,001), men OR (Exp (B) inkluderar 1 (1,0-1,001)!? Ser man strikt till procentdelar så borde det föreligga skillnad. Jag kan inte se några uppenbara fel i materialet. Hur tänker Du?
Mvh

Svara
Helen skriver:

juni 14, 2014 kl. 20:25

Hej, jag försöker jämföra två medelvärden för två grupper med hjälp av Independent t-test, men kolumnerna för Levenes test är helt tomma. Varför? I ett av fallen där jag testat ärskillnaden i medelvärde -,033. Det är allt som går att utläsa av analysen. Vad gör jag för fel?
Helén

Svara
Jasmine skriver:

september 20, 2014 kl. 09:46

När man ska göra beroende t-test på före- och eftermätning, är det nödvändigt att normalfördelning föreligger? Min handledare säger att hon har gjort t-test trots att hennes sample inte varit normalfördelat. Hennes privata statistiker uppger samma information. Hur ser du på det?

När jag undersöker normalfördelning för jag över både före- och eftermätningen till ”Dependent List”. Borde någon av mätningarna föras över till ”Factor List”? Under ”plots”, är det av vikt om ”Boxplots” är ”Factor levels together”, ”Dependents together” eller ”None”?

Mitt resultat blir Shapiro-Wilk, Sig. på 0.048 och 0.004, vilket (om jag inte missminner mig) innebär att normalfördelning inte föreligger? Hur bör jag bäst gå tillväga härifrån? Vad kan jag göra nu? Vad säger denna t-testningen mig?

Ytterst tacksam för svar!

Svara
Erik skriver:

november 21, 2014 kl. 12:07

Tack för din hjälp ;)

Svara
Kristin skriver:

april 13, 2015 kl. 13:48

Hej Anders!

Jag har en fråga om hur jag redovisar resultatet från mina t-test i min uppsats. Vad behöver vara med? Räcker det med till exempel means, sd och p-värde i en tabell eller behöver jag ha med fler (t. ex se, t, df)?

Tack för en väldigt bra och informativ sida,

Vänliga hälsningar,

Kristin

Svara
Therese skriver:

maj 4, 2015 kl. 08:38

Hej! Kanske har ni redan svarat på detta i någon annan läsarfråga eller guide, och då får jag börja med att be om ursäkt för dåligt letande eller dålig förståelse av lästa guider från min sida! Jag är inte tillräckligt bra på statistik för att använda rätt termer tror jag men bare with me:

Jag ska analysera Hb-värde hos dels dem som haft blödningshändelser och jämföra dem med de som inte haft blödningshändelser – detta har gått fint eftersom de med blödningshändelser har värdet 1 för variabeln ”Blödningshändelse” och de utan händelse har värdet 0 (använde independent samples t-test). Problemet uppstår nu när jag ska jämföra Hb hos kvinnor med blödningshändelser med Hb hos kvinnor utan blödningshändelser – jag behöver ju då slå ihop två variabler (Kön och Blödningshändelse). Hänger ni med på hur jag menar? Variabeln Kön där kvinna=1 och man=2, samt variabeln blödningshändelse.

Tacksam för hjälp, och tack för en fantastisk sida!
/Therese

Svara
Therese L skriver:

maj 8, 2015 kl. 10:54

Hej! Jag har problem med att gör ett t-test. Jag har flera olika Y variabler (tillväxt i %) och bara en x variabel (år), jag ska jämföra hur utvecklingen ser ut över tiden, så den kommer med stor sannolik inte vara linjär. Jag tänkte därför att jag skulle ta ut ett geometriskt medelvärde för respektive år, och sedan testa detta med ett t-test för att säkerställa att det geometriska medelvärdet är korrekt. för att sedan plotta ut varje års medelvärde på en graf.

Så min fråga är, går det att testa (med t-test) om ett medelvärde är signifikant för tex år 1 och sedan ett annat medelvärde är signifikant för år 2 osv. Ska t-testet vara tvåsidigt, har det olika varianser, mm?

Tack för en superbra sida!

/Therese L

Svara
Lililll skriver:

maj 8, 2015 kl. 22:31

Hej!
Finns det uppgifter där man inte kan bestämma median ? Alltså om det är en uppgift med olika sport, och man ska bestämma median, då kan man ju inte väl bestämma median. Om det är så att man inte kan bestämma media,varför är det så? Är det för att det är sport och inte siffror?

Svara
Zandra skriver:

maj 11, 2015 kl. 10:44

Hej! Jag har undersökt om personlighet är en bidragande faktor till vad individer väljer att status uppdatera om på Facebook. Under personlighet finns 5 olika variabler: extraversion,öppenhet för nya erfarenheter, vänlighet, målmedvetenhet och ängslighet. För Facebook finns det 7 olika alternativ om vad man väljer att status uppdatera om. Det jag undrar är vilken analys jag bör göra för att få ut om det finns ett samband mellan personlighet och stausuppdateringarnas innehåll? Jag skulle bli oerhört tacksam för svar!
MVH Zandra

Svara
moaolin skriver:

maj 13, 2015 kl. 17:35

Hej!
Som ett tidigt steg i min analys vill jag jämföra medelvärden, till skillnad från det du beskriver ovan vill jag jämföra medelvärdet på min oberoende variabel (administrativ kapacitet skalan 0-1) mellan de två grupper som min dikotoma beroende variabel utgörs av (länder som har eller inte har arbetslöshetsförsäkringar). Är det möjligt/korrekt? Jag har utfört det och tycker att det ser rimligt ut/fyller en funktion på så vis att jag får en bild av skillnaden mellan grupperna är signifikant. Är jag ute och cyklar?

Mvh Moa

I nästa steg i min analys ska jag göra en logistisk

Svara
Nathalie skriver:

december 16, 2015 kl. 20:29

Hej!
Om jag vill utföra ett t-test på två grupper som ligger i samma grupp hur gör jag då? Jag har alltså en variabel som heter ”grupper” där jag kodat alla i kontrollgruppen till 2 och alla i huvudgruppen till 1. Min handledare ville ha ett t-test mellan grupperna. Har kört ”split file” men.. då får jag ju bara m för ena gruppen?

Svara
N skriver:

oktober 18, 2016 kl. 11:36

Hej!
Jag ska jämföra en yrkesgrupp som jag undersökt välmåendet på med hjälp av en enkät med poängskala (0-4 aldrig-mycket ofta) med en annans undersökning som använt sig av samma enkät. Tanken är att jag ska få ut median och sd. Men kan jag på något vis få fram och jämföra signifikansnivån? jag har ju inte den andras data, utan bara resultat, kan jag ändå få fram och jämföra min grupp med resultaten från en annan? Hur går detta i så fall till? som sagt har bara data från min grupp.

Svara
Hannah skriver:

november 27, 2017 kl. 14:19

Hej, Vi ska göra en jämförelse mellan 6 olika insektsspreyer. Vi har för varje spray fått 12 oberoende mätningar. Resultatet visar sen antalet insekter som fanns kvar efter behandling.

Vi ska testa om det är skillnad i medelantal insekter mellan de olika sprayerna, hur gör v i detta. Räcker det att jämföra medelvärdena för var och en. Eller gäller t-test eller anova.?

Tack på förhand!

Svara
Oskar Hanborg skriver:

december 14, 2017 kl. 22:39

Hej,

tack för guiden. Jag skriver uppsats nu och spssakuten är guld! =)

En tanke dock (som jag gissar att jag har fel på). Men detta stycke i texten tänker jag är fel:
”En förutsättning för att vi ska kunna signifikanstesta skillnaderna mellan grupperna är att spridningen inom grupperna är densamma. Det är det Levene’s test visar. Ett Sig-värde som är under ,050 betyder att spridningen inte är densamma. Då får man titta i raden ”Equal variances not assumed”. Om sig-värdet är högre än ,050 kan vi utgå ifrån att spridningen är densamma, och kollar då på raden ”Equal variances assumed”.”

Är det inte tvärtom? Borde inte ett osignifikant värde på ”Equal variances assumed”raden innebära att vi då kollar ner på ”Equal variances not assumed” för att se om detta är signifikant? Signifiakant på ”Equal variances not assumed” innebär väl ett de två grupperna man testar (tex man / kvinna) mot en variabel (tex empati) påvisar att de skiljer sig?

Svara
1. Anders Sundell skriver:
  
  december 15, 2017 kl. 09:08
  
  Hej, nej det ska vara som det står.
  Levene’s test kollar om det finns någon signifikant skillnad i varians mellan de två grupperna. Om skillnaden i VARIANS är signifikant måste vi titta på raden ”Equal variances not assumed”. Om skillnaden i varians är insignifikant kan vi fortsätta tänka att spridningen är densamma i de båda grupperna.
  
  Skillnaden mellan grupperna i variabeln man testar – tex empati hos män och kvinnor – är ett test av huruvida det finns en signifikant skillnad i medelvärde. Det ser man i kolumnen ”Sig (2-tailed)”.
  
  /Anders
  
  Svara
  1. Oskar Hanborg skriver:
    
    december 17, 2017 kl. 17:53
    
    Hej Tack Anders! =)
    
    Så Levenes test ”signifikanskolumnen” avser bara vilken rad vi ska kolla på (mellan equal variance assumed eller equal variance not assumed)?
    
    I hennes eminenta SPSS-bok står följande angående det vi diskuterar och det är detta stycke text som gör att jag frågar. Angående ”homogeneity of variance”, sid 214-215:
    ”To test this, SPSS performs Levenes test for equality of variance as part of the t-test and analysis of variance analyses. …. Be careful in interpreting these results of this test: you are hoping to find that the test is not sig. (i.e a sig level greater than .05). If you obtain a significance value of less than .05 this suggests that variance for the two groups are not equal and you have therefore violeted the assumption of homogeneity of variance.””
jenny skriver:

januari 23, 2018 kl. 00:24

Hej.
Jag vill kolla statistik signifikans i medelvärde mellan kön och blodsockervärde. Blodsockervärde är en kvantitativ variabel och är ej normalfördelad. Om jag förstått det rätt kan jag inte då använda mig av independent sample t test? Vilken analys kan jag använda mig av istället? All min kvantitativ data är inte normalfördelad.

Svara
Simone skriver:

februari 22, 2018 kl. 09:17

Hej! Varför är det så att man måste välja olika test metoder om man kan anta att variansen mellan populationer är like eller inte. Jag förstår att man ska, men vad är den bakomliggande orsaken?

Svara
Helena skriver:

mars 12, 2018 kl. 11:19

Ska man välja equal variaces assumed om levenes test blir exakt 0.05?

Svara
J & C skriver:

april 17, 2018 kl. 10:42

Hej!

Hur skriver man ut ett icke signifikant resultat på t-test ? Vi skriver en c-uppsats och där en av frågeställningarna rör ett t-test som inte är signifikant och chansar på att fråga här om du/ni vet.
Hur skriver man detta i text? Skriver man bara ut siffrorna som vanligt och därmed kan läsarna själva se att det inte är signifikant? Vi nämner även i texten att det inte är signifikant. Vi hade först inte med siffrorna som talar om M och SD då resultatet inte är intressant när det inte är signifikant, men vår examinator antyder att siffrorna bör vara med så frågar är egentligen om man kanske även bör skriva ut ; t (xx,xx) = x.xx p>.05 ?

Hoppas det inte blev för rörigt utan att det går att förstå vår fråga.

Tack på förhand !

Svara
DarnellJuicy skriver:

juli 27, 2018 kl. 21:25

Hi. I see that you don’t update your website too often. I know that writing content is
boring and time consuming. But did you know that there is a tool that allows
you to create new articles using existing content (from article directories
or other blogs from your niche)? And it does it very well.
The new articles are unique and pass the copyscape
test. You should try miftolo’s tools

Svara
Emma Svensson skriver:

februari 27, 2019 kl. 10:50

Hej! vi gör en magisteruppsats. Hoppas på lite hjälp då vi ej får någon från vårt universitet.
Vi har gjort en observationsstudie ute på två olika sjukshus. Där har vi undersökt olika omvårdnadsåtgärder som utfördes för att förebygga hypotermi (att man blir nedkyld) under operation. Våra svarsalternativ för vårt protokoll som vi följde var jag/nej. Vi kollade sammanlagt på 12 st åtgärder på 43 olika operationer.
Vi behöver göra någon form av jämförelser mellan de två olika sjukhusen, är T- test det bästa alternativet eller? Vi får inte riktigt till det i SPSS…
Vi förstår inte riktigt hur vi ska ställa upp det i SPSS.

Mvh Emma Svensson

Svara
Lola skriver:

maj 10, 2019 kl. 13:32

Jag känner nu hur lite våra lärare har förberett oss på SPSS. Tre kurser och de tror att det räcker att ha den förra kursen och den vi har nu 1,5 år emellan. Vilsen och frustrerad 😣

Svara
Angelica skriver:

september 22, 2022 kl. 10:10

Hej,
Hur tar man fram medelvärdet av två kvalitativa variabler, tex kön och vart skulle du vilja placera liberalerna?
Tack!
/Angelica

Svara