Sätt att beräkna avvikelse på

Författare: Robert Simon
Skapelsedatum: 21 Juni 2021
Uppdatera Datum: 1 Juli 2024
Anonim
Sätt att beräkna avvikelse på - Tips
Sätt att beräkna avvikelse på - Tips

Innehåll

Varians mäter spridningen av datamängden. Det är mycket användbart för att bygga statistiska modeller: låg variation kan vara en indikation på att du beskriver slumpmässigt fel eller brus istället för det underliggande förhållandet i data. Med den här artikeln lär wikiHow dig hur du beräknar varians.

Steg

Metod 1 av 2: Beräkna variansen för ett prov

  1. Skriv din provdatauppsättning. I de flesta fall har statistiker endast information om ett urval eller delmängd av befolkningen de studerar. Till exempel, istället för att analysera "kostnaden för varje bil i Tyskland", kan en statistiker hitta kostnaden för ett slumpmässigt urval på några tusen bilar. Statistiken kan använda detta exempel för att få en bra uppskattning av bilkostnaderna i Tyskland. Det är dock mer troligt att det inte exakt matchar de faktiska siffrorna.
    • Till exempel: När du analyserade antalet sålda muffins per dag på ett kafé tog du ett slumpmässigt sex dagars prov och fick följande resultat: 38, 37, 36, 28, 18, 14, 12, 11, 10,7, 9,9. Detta är ett urval, inte en population, eftersom du inte har data för varje dag som butiken är öppen.
    • Om varje Datapunkter i mastern, gå till metoden nedan.

  2. Skriv ner formelns variansformel. Variansen hos en datamängd anger graden av datapunkternas spridning. Ju närmare variansen är noll desto närmare är datapunkterna grupperade. När du arbetar med exempeluppsättningar, använd följande formel för att beräkna varians:
    • = /(n - 1)
    • är variansen. Varians beräknas alltid i kvadratiska enheter.
    • representerar ett värde i din datamängd.
    • ∑, som betyder "summa", berättar att du beräknar följande parametrar för varje värde och sedan lägger till dem tillsammans.
    • x̅ är medelvärdet av provet.
    • n är antalet datapunkter.

  3. Beräkna medelvärdet av provet. Symbolen x̅ eller "x-horisontell" används för att ange provets medelvärde. Beräkna som i genomsnitt: lägg upp alla datapunkter och dela det med antalet poäng.
    • Till exempel: Lägg först till dina datapunkter: 17 + 15 + 23 + 7 + 9 + 13 = 84
      Därefter delar du resultatet med antalet datapunkter, i det här fallet sex: 84 ÷ 6 = 14.
      Provmedelvärde = x̅ = 14.
    • Du kan tänka på medelvärdet som "mittpunkten" för data. Om data är centrerade kring medelvärdet är variansen låg. Om de är spridda långt från medelvärdet är variansen hög.

  4. Subtrahera medelvärdet från varje datapunkt. Nu är det dags att beräkna - x̅, där varje punkt i din datamängd är. Varje resultat indikerar avvikelse från medelvärdet för varje motsvarande punkt, eller för att uttrycka det enkelt, avståndet från det till medelvärdet.
    • Till exempel:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • Det är väldigt enkelt att kontrollera dina beräkningar, eftersom resultaten måste summeras till noll. Det beror på att medelvärdet av medelvärdet är de negativa resultaten (avståndet från medelvärdet till små tal). positiva resultat (avstånd från medelvärde till större antal) elimineras helt.
  5. Kvadratera alla resultat. Som nämnts ovan har den nuvarande avvikelseslistan (- x̅) en summa av noll. Det betyder att "genomsnittlig avvikelse" också alltid kommer att vara noll och ingenting kan sägas om spridningen av data. För att lösa detta problem hittar vi kvadraten för varje avvikelse. Tack vare det är alla positiva tal, negativa värden och positiva värden upphäver inte längre varandra och ger summan noll.
    • Till exempel:
      (- x̅)
      - x̅)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Du har nu (- x̅) för varje datapunkt i exemplet.
  6. Hitta summan av kvadratvärdena. Nu är det dags att beräkna hela täljaren med formeln: ∑. Den stora cykeln, ∑, kräver att du lägger till följande elementvärde för varje värde. Du har beräknat (- x̅) för varje värde i provet, så allt du behöver göra är att bara lägga till resultaten tillsammans.
    • Till exempel: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Dela med n - 1, där n är antalet datapunkter. För länge sedan, vid beräkning av provvarians, delades statistiker bara av n. Den uppdelningen ger dig medelvärdet av den kvadrerade avvikelsen, som exakt matchar variansen för det urvalet. Tänk dock på att urvalet endast är en uppskattning av en större population. Om du tar ett nytt slumpmässigt urval och gör samma beräkning får du ett annat resultat. När det visar sig att dela med n -1 istället för n ger dig en bättre uppskattning av variansen hos en större befolkning - som du verkligen bryr dig om. Denna korrigering är så vanlig att det nu är den accepterade definitionen av provvarians.
    • Till exempel: Det finns sex datapunkter i urvalet, så n = 6.
      Provvarians = 33,2
  8. Förstå varians och standardavvikelse. Observera att, eftersom det finns befogenheter i formeln, mäts variansen i kvadraten för enheterna med originaldata. Detta är visuellt förvirrande. Istället är standardavvikelsen ofta ganska användbar. Men det är ingen mening att slösa bort någon ansträngning, eftersom standardavvikelsen bestäms av kvadratroten av variansen. Det är därför som provvariansen är skriven i termer och standardavvikelsen för ett prov är.
    • Till exempel är standardavvikelsen för ovanstående prov = s = √33.2 = 5.76.
    annons

Metod 2 av 2: Beräkna variationen hos en population

  1. Börjar med huvuddatauppsättningen. Termen "befolkning" används för att hänvisa till alla relevanta observationer. Om du till exempel undersöker åldern för invånarna i Hanoi kommer din totala befolkning att inkludera åldrarna för alla personer som bor i Hanoi. Vanligtvis skulle du skapa ett kalkylblad för en stor datamängd som denna, men här är en mindre datamängd:
    • Till exempel: I rummet i ett akvarium finns det exakt sex akvarier. Dessa sex tankar innehåller följande antal fiskar:





  2. Skriv ner formeln för total varians. Eftersom en population innehåller alla data vi behöver, ger denna formel oss den exakta variationen i befolkningen. För att skilja det från provvariansen (som bara är en uppskattning) använder statistiker andra variabler:
    • σ = /n
    • σ = provvarians. Detta är den normalt kvadrerade korven. Varians mäts i kvadratiska enheter.
    • representerar ett element i din datamängd.
    • Elementet i ∑ beräknas för varje värde och läggs sedan till.
    • μ är det totala medelvärdet.
    • n är antalet datapunkter i befolkningen.
  3. Hitta medelvärdet för befolkningen. Vid analys av en population representerar symbolen μ ("mu") det aritmetiska medelvärdet. För att hitta medelvärdet, lägg upp alla datapunkter och dela sedan med antalet poäng.
    • Du kan tänka på medelvärdet som "genomsnitt", men var försiktig, för ordet har många matematiska definitioner.
    • Till exempel: medelvärde = μ = = 10,5
  4. Subtrahera medelvärdet från varje datapunkt. Datapunkter närmare medelvärdet har en skillnad närmare noll. Upprepa subtraheringsproblemet för alla datapunkter och du kommer förmodligen att känna spridningen av data.
    • Till exempel:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. Kvadratera varje skylt. Vid denna tidpunkt kommer vissa resultat som erhållits från föregående steg att vara negativa och vissa kommer att vara positiva.Om data ska visualiseras på en isometrisk linje representerar dessa två objekt siffrorna till vänster och höger om medelvärdet. Detta skulle vara till någon nytta vid beräkning av varians, eftersom dessa två grupper skulle avbryta varandra. Istället kvadratera dem alla så att de alla är positiva.
    • Till exempel:
      (- μ) för varje värde av i går från 1 till 6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Hitta genomsnittet av dina resultat. Du har nu ett värde för varje datapunkt, relaterat (inte direkt) till hur långt borta datapunkten är från medelvärdet. Genomsnitt genom att lägga ihop dem och dela med antalet värden du har.
    • Till exempel:
      Total varians = 24,25
  7. Kontaktrecept. Om du inte är säker på hur detta passar den formel som beskrivs i början av metoden, skriv ner hela problemet för hand och förkorta inte:
    • Efter att ha hittat skillnaden från medelvärdet och kvadrering får du (- μ), (- μ) och så vidare tills (- μ), var är den sista datapunkten. i datamängden.
    • För att hitta medelvärdet av dessa värden, lägg dem tillsammans och dela med n: ((- μ) + (- μ) + ... + (- μ)) / n
    • Efter att du har skrivit om täljaren med sigmoidnotation har du /n, formelvarians.
    annons

Råd

  • Eftersom variansen är svår att tolka beräknas detta värde ofta som utgångspunkt för att hitta standardavvikelsen.
  • Att använda "n-1" istället för "n" i nämnaren är en teknik som kallas Bessel-korrigering. Provet är endast en uppskattning av en fullständig population, och medelvärdet av provet har en viss förspänning för att matcha den uppskattningen. Denna korrigering eliminerar ovannämnda förspänning. Det gäller det faktum att när n - 1 datapunkter har räknats upp, den sista punkten n var en konstant, eftersom endast vissa värden användes för att beräkna medelvärdet av provet (x̅) i variansformeln.