Hur man utvärderar statistisk signifikans

Författare: Randy Alexander
Skapelsedatum: 2 April 2021
Uppdatera Datum: 26 Juni 2024
Anonim
Hur man utvärderar statistisk signifikans - Tips
Hur man utvärderar statistisk signifikans - Tips

Innehåll

Hypotesprovning styrs av statistisk analys. Statistiskt signifikant konfidens beräknas med p-värde - vilket indikerar sannolikheten för ett observerat resultat när en viss (nollhypotes) är sant. Om p-värdet är lägre än signifikansnivån (vanligtvis 0,05) kan experimentet dra slutsatsen att det finns tillräckligt med bevis för att motbevisa nollhypotesen och erkänna den omvända hypotesen. Med ett enkelt t-test kan du beräkna p-värdet och bestämma betydelsen mellan två olika datagrupper.

Steg

Del 1 av 3: Ställ in dina experiment

  1. Bestäm din hypotes. Det första steget i att utvärdera statistisk signifikans är att identifiera de frågor som ska besvaras och att förklara din hypotes. Hypotes är ett uttalande av empiriska data och möjliga avvikelser i befolkningen. Varje experiment har en nollhypotes och en invers hypotes. I allmänhet kommer du att jämföra två grupper för att se om de är desamma eller olika.
    • I allmänhet är hypotesen inte (H0) bekräfta att det inte finns någon skillnad mellan de två datagrupperna. Exempel: Studenter som läser materialet innan klassen får inte bättre slutbetyg.
    • Den omvända hypotesen (Ha) strider mot nollhypotesen och är ett uttalande som du försöker stödja med dina empiriska data. Till exempel: Studenter som läser materialet före lektionen får faktiskt bättre slutbetyg.

  2. Välj signifikansnivå för att bestämma graden av skillnad som kan ses som meningsfull i data. Betydelsens nivå (även känd som alfa) är tröskeln du väljer för att bestämma betydelsen. Om p-värdet är mindre än eller lika med en given signifikansnivå anses data vara statistiskt signifikanta.
    • Som en allmän regel väljs signifikansnivån (eller alfa) vanligtvis på 0,05-nivån - vilket innebär att sannolikheten för att observera skillnaden på data endast är slumpmässig endast 5%.
    • Ju högre konfidensnivå (och därmed ju lägre p-värde), desto mer meningsfull blir resultaten.
    • Om mer självförtroende krävs, sänk p-värdet till 0,01. Ett lågt p-värde används ofta vid tillverkning för att upptäcka produktfel. Hög tillförlitlighet är så viktigt att det är acceptabelt att varje del fungerar som den ska.
    • För de flesta hypotesbaserade experiment är en signifikansnivå på 0,05 acceptabel.

  3. Bestäm om du vill använda ett ensidigt eller tvåsidigt test. Ett av t-testantagandena är att dina data är i en normalfördelning. Normalfördelningen kommer att bilda en klockkurva med majoriteten av observationerna centrerade. T-testet är ett matematiskt test som kontrollerar om dina data faller på utsidan av normalfördelningen, över eller under, i den "översta" delen av kurvan.
    • Om du är osäker på om data ligger över eller under kontrollgruppen, använd ett tvåsidigt test. Det låter dig kontrollera betydelsen i båda riktningarna.
    • Om du vet vad den förväntade riktningen för dina data är, använd ett test med en svans. I exemplet ovan förväntar du dig att studentens poäng kommer att förbättras. Därför använder du ensidigt test.

  4. Bestäm provstorlek med kraftanalys. Testets kraft är förmågan att observera det förväntade resultatet med en given provstorlek. Den gemensamma tröskeln för kraft (eller β) är 80%. Kraftanalys kan vara ganska komplicerad utan några preliminära data eftersom du behöver lite information om det förväntade medelvärdet mellan grupperna och deras standardavvikelser. Använd online kraftanalys för att bestämma den optimala provstorleken för dina data.
    • Forskare utför ofta en liten premissstudie för att informera om kraftanalysen och bestämma den provstorlek som behövs för en stor och omfattande studie.
    • Om det inte finns några medel för att göra komplexa premissundersökningar, uppskatta det möjliga medelvärdet baserat på att läsa artiklar och forskning som andra kan ha gjort. Det kan ge dig en bra start med att bestämma provstorlekar.
    annons

Del 2 av 3: Beräkna standardavvikelsen

  1. Bestäm formeln för standardavvikelse. Standardavvikelse mäter spridningen av data. Det ger dig information om identiteten för varje datapunkt i provet. När första gången kommer igång kan ekvationer se ganska komplicerade ut. Men stegen nedan hjälper dig att enkelt förstå beräkningen. Formeln är s = √∑ ((xi - ^) / (N - 1)).
    • s är standardavvikelsen.
    • ∑ indikerar att du måste lägga till alla samlade observationer.
    • xi var och en representerar ditt datavärde.
    • µ är medelvärdet av data för varje grupp.
    • N är det totala antalet observationer.
  2. Genomsnittligt antal observationer i varje grupp. För att beräkna standardavvikelsen måste du först beräkna medelvärdet av observationerna för varje enskild grupp. Detta värde symboliseras med den grekiska bokstaven mu eller µ. För att göra det, lägg bara till observationerna och dela med det totala antalet observationer.
    • Till exempel, för att hitta medelvärdet för den grupp som läser materialet före lektionen, låt oss ta en titt på några data. För enkelhetens skull kommer vi att använda en datamängd på 5 poäng: 90, 91, 85, 83 och 94 (på en 100-punkts skala).
    • Lägg till alla observationer: 90 + 91 + 85 + 83 + 94 = 443.
    • Dela summan ovan med antalet observationer N (N = 5): 443/5 = 88,6.
    • Medelpoängen för denna grupp är 88,6.
  3. Subtrahera genomsnittet från varje observerat värde. Nästa steg involverar del (xi - µ) av ekvationen. Subtrahera medelvärdet från varje observerat värde. Med ovanstående exempel har vi fem subtraktioner.
    • (90 - 88,6), (91-88,6), (85 - 88,6), (83 - 88,6) och (94 - 88,6).
    • Det beräknade värdet är 1,4; 2,4; -3,6; -5,6 och 5,4.
  4. Kvadrat ovanstående skillnader och lägg upp dem. Varje ny beräknat värde kommer nu att kvadreras. Här kommer också det negativa tecknet att tas bort. Om ett negativt tecken visas efter detta steg eller i slutet av beräkningen kan du ha glömt att göra ovanstående steg.
    • I vårt exempel kommer vi nu att arbeta med 1,96; 5,76; 12,96; 31,36 och 29,16.
    • Lägg till dessa rutor tillsammans: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Dela med det totala antalet observationer minus 1. Att dividera med N - 1 hjälper till att kompensera för en beräkning som inte utförs på populationen som helhet, men som bara baseras på ett urval i populationen för alla studenter.
    • Subtrahera: N - 1 = 5 - 1 = 4
    • Dela: 81,2 / 4 = 20,3
  6. Få kvadratroten. När du delat med antalet observationer minus 1 tar du kvadratroten av det erhållna värdet. Detta är det sista steget i beräkningen av standardavvikelsen. Vissa statistiska program hjälper dig att utföra denna beräkning efter att originaldata har importerats.
    • Med exemplet ovan är standardavvikelsen för slutet av terminens betyg för studenter som läser dokumentet före lektionen: s = √20,3 = 4,51.
    annons

Del 3 av 3: Bestämning av statistisk signifikans

  1. Beräkna avvikelsen mellan dina två observationsgrupper. Fram till denna punkt har exemplet endast behandlat en grupp observationer. För att jämföra två grupper behöver du uppenbarligen data från båda. Beräkna standardavvikelsen för den andra observationsgruppen och använd den för att beräkna avvikelsen mellan de två experimentgrupperna. Formeln för beräkning av varians är: sd = √ ((s1/ N1) + (s2/ N2)).
    • Sd är variansen mellan grupperna.
    • S1 är standardavvikelsen för grupp 1 och N1 är storleken på grupp 1.
    • S2 är standardavvikelsen för grupperna 2 och N2 är storleken på grupp 2.
    • I vårt exempel, låt oss säga att data från grupp 2 (elever som inte läste texten före lektionen) har en storlek på 5 och en standardavvikelse på 5,81. Variansen är:
      • Sd = √ ((s1) / N1) + ((s2) / N2))
      • Sd = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Beräkna t-poängen för data. Med T-statistik kan du konvertera data till ett formulär som är jämförbart med andra data. Med t-värdet kan du också utföra ett t-test, ett test som låter dig beräkna sannolikheten för att de två grupperna är statistiskt olika. Formeln för beräkning av t-statistiken är: t = (µ1 – µ2) / Sd.
    • µ1 är genomsnittet för den första gruppen.
    • µ2 är genomsnittet för den andra gruppen.
    • Sd är avvikelsen mellan observationerna.
    • Använd det större medelvärdet som µ1 för att inte få en negativ t-statistik.
    • Antag för vårt exempel att det observerade medelvärdet för grupp 2 (som inte läste föregående artikel) är 80. T-poängen är: t = (µ1 – µ2) / Sd = (88,6 – 80)/3,29 = 2,61.
  3. Bestäm graden av frihet för provet. När du använder t-statistiken bestäms frihetsgraderna baserat på provstorleken. Lägg till antalet observationer för varje grupp och subtrahera sedan två. I exemplet ovan är frihetsgraden (d.f.) 8 eftersom det finns 5 prover i den första gruppen och 5 prover i den andra gruppen ((5 + 5) - 2 = 8).
  4. Använd tabell t för att utvärdera betydelse. Tabeller över t-värden och frihetsgrader finns i en standardstatistikbok eller online. Hitta raden som innehåller dataens frihetsgrader och p-värdet som motsvarar den t-statistik du har.
    • Med frihetsgrader 8 och t = 2,61 ligger p-värdet för ett ensidigt test mellan 0,01 och 0,025. Eftersom den valda signifikansnivån är mindre än eller lika med 0,05 är våra data statistiskt signifikanta. Med dessa data förkastar vi nollhypotesen och accepterar den inversa hypotesen: studenter som läser materialet innan klassen har högre slutresultat.
  5. Överväg att bedriva ytterligare forskning. Många forskare utför premissstudier med flera mått för att förstå hur man utformar en större studie. Att göra annan forskning med mer mått kommer att öka ditt förtroende för dina slutsatser. annons

Råd

  • Statistik är ett stort och komplext fält. Gå en gymnasium eller universitet (eller högre) kurs för statistisk hypotesprovning för att förstå statistisk signifikans.

Varning

  • Denna analys fokuserar på t-testet för att kontrollera skillnaden mellan de två normalfördelningspopulationerna. Beroende på informationens komplexitet kan du behöva ett nytt statistiskt test.