Beräkna kovarians

Författare: Judy Howell
Skapelsedatum: 2 Juli 2021
Uppdatera Datum: 1 Juli 2024
Anonim
Beräkna kovarians - Råd
Beräkna kovarians - Råd

Innehåll

Kovarians är en statistisk beräkning för att göra förhållandet mellan två datamängder mer transparent. Antag till exempel att antropologer studerar höjden och vikten av en befolkning inom en viss kultur. För varje person i studien kan längd och vikt visas med ett par data (x, y). Dessa värden kan användas i en standardformel för beräkning av kovariansförhållandet. Den här artikeln förklarar först beräkningarna för bestämning av en datamängds kovarians. Därefter kommer två andra automatiserade sätt att bestämma resultatet att diskuteras.

Att gå

Metod 1 av 4: Beräkna kovariansen för hand med standardformeln

  1. Lär dig standardformeln för kovarians och dess delar. Standardformeln för beräkning av kovarians är Σ(XiXgenomsnitt)(yiygenomsnitt)/(n1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}Konstruera din datatabell. Innan du börjar är det bra att samla in dina data. Skapa en tabell bestående av fem kolumner. Du måste deklarera varje kolumn enligt följande:
    • X{ displaystyle x}Beräkna medelvärdet av x datapunkter. Denna provdatauppsättning innehåller 9 nummer. För att hitta medelvärdet, lägg dem tillsammans och dela summan med 9. Detta ger resultatet 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. När du delar detta med 9 får du genomsnittet 4,89. Detta är det värde du kommer att använda som x (avg) för de kommande beräkningarna.
    • Beräkna medelvärdet för y-datapunkterna. Denna y-kolumn måste också bestå av 9 datapunkter som sammanfaller med x-datapunkterna. Bestäm genomsnittet av dessa. För denna samplingsdatauppsättning blir detta 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Dela denna summa med 9 för att få ett genomsnitt på 5,44. Du kommer att använda 5.44 som värdet på y (avg) för de kommande beräkningarna.
    • Beräkna värdena (XiXgenomsnitt){ displaystyle (x_ {i} -x _ { text {avg}})}Beräkna värdena (yiygenomsnitt){ displaystyle (y_ {i} -y _ { text {avg}})}Beräkna produkterna för varje datarad. Du fyller i raderna i den sista kolumnen genom att multiplicera siffrorna du beräknade i de två föregående kolumnerna (XiXgenomsnitt){ displaystyle (x_ {i} -x _ { text {avg}})}Hitta summan av värdena i den sista kolumnen. Det är här the-symbolen kommer in. Efter att ha gjort alla beräkningar hittills, lägg till resultaten tillsammans. För denna exempeldatauppsättning ska du nu ha nio värden i den sista kolumnen. Lägg till de nio siffrorna tillsammans. Var noga med om ett tal är positivt eller negativt.
      • Summan av denna exempeldatamängd bör uppgå till -64,57. Skriv denna summa i utrymmet längst ner i kolumnen. Detta är värdet på täljaren för standardkovariansformeln.
    • Beräkna nämnaren för kovariansformeln. Täljaren för standardkovariansformeln är det värde du just beräknat. Nämnaren representeras av (n-1) och är en mindre än antalet par av datan i din datamängd.
      • I detta exempelproblem finns det nio datapar, så n är 9. Därför är värdet på (n-1) lika med 8.
    • Dela täljaren med nämnaren. Det sista steget i beräkningen av kovariansen är att dela täljaren, Σ(XiXgenomsnitt)(yiygenomsnitt){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}Lägg märke till vad de repetitiva beräkningarna finns. Kovarians är en beräkning som du måste göra för hand några gånger så att du förstår innebörden av resultatet. Men om du rutinmässigt ska använda kovarians för att tolka data behöver du ett snabbare och mer automatiserat sätt att få resultaten. Nu har du kanske lagt märke till att beräkningarna bestod av två medel, arton separata subtraktioner, nio multiplikationer, en addition och slutligen en annan division med vår relativt lilla datamängd på bara nio datapar. Det är 31 relativt små beräkningar för att hitta lösningen. Längs vägen riskerar du att missa negativa tecken eller kopiera resultaten felaktigt så att svaret inte längre är korrekt.
    • Skapa ett kalkylblad för beräkning av kovariansen. Om du är bekant med Excel (eller ett annat beräkningsprogram) kan du enkelt skapa en tabell för att bestämma kovariansen. Märk rubrikerna för de fem kolumnerna som för beräkningarna för hand: x, y, (x (i) -x (avg)), (y (i) -y (avg)) och Product.
      • För att förenkla namngivningen kallar du den tredje kolumnen något som "x skillnad" och den fjärde kolumnen "y skillnad", så länge du kommer ihåg betydelsen av data.
      • Om tabellen börjar i det övre vänstra hörnet av kalkylbladet kommer cell A1 att märkas x, medan de andra etiketterna fortsätter upp till cell E1.
    • Ange datapunkterna. Ange datavärdena i de två kolumnerna x och y. Kom ihåg att datapunkternas ordning har betydelse, så du måste matcha varje y med motsvarande värde på x.
      • X-värdena börjar i cell A2 och fortsätter upp till antalet datapunkter du behöver.
      • Y-värdena börjar i cell B2 och fortsätter upp till antalet datapunkter du behöver.
    • Bestäm medelvärdet för x- och y-värdena. Excel beräknar genomsnittet för dig mycket snabbt. I den första tomma cellen under varje datakolumn skriver du formeln = GENOMSNITT (A2: A ___). Fyll det tomma utrymmet med numret på cellen som motsvarar din senaste datapunkt.
      • Om du till exempel har 100 datapunkter, fylls cellerna A2 till A101, så i cellen skriver du = GENOMSNITT (A2: A101).
      • För y-data, skriv formeln = GENOMSNITT (B2: B101).
      • Kom ihåg att en formel i Excel börjar med ett "=" -tecken.
    • Skriv formeln för kolumnen (x (i) -x (avg)). Ange formeln för beräkning av den första subtraktionen i cell C2. Denna formel blir: = A2 -___. Fyll det tomma utrymmet med celladressen som innehåller medelvärdet för x-data.
      • Till exempel av de 100 datapunkterna kommer genomsnittet att vara i cell A103, så din formel blir: = A2-A103.
    • Upprepa formeln för datapunkterna (y (i) -y (avg)). Efter samma exempel kommer den in i cell D2. Formeln blir: = B2-B103.
    • Skriv formeln för kolumnen "Produkt". I den femte kolumnen skriver du formeln för cell E2 för att beräkna produkten från de två föregående cellerna. Detta blir då: = C2 * D2.
    • Kopiera formlerna för att fylla tabellen. Hittills har du bara programmerat de första datapunkterna i rad 2. Markera cellerna C2, D2 och E2 med musen. Placera markören på den lilla rutan i det nedre högra hörnet tills ett plustecken visas. Klicka och håll ner musknappen och dra ner musen för att utöka urvalet och fylla i hela datatabellen. Detta steg kopierar automatiskt de tre formlerna från cellerna C2, D2 och E2 till hela tabellen. Tabellen bör fyllas automatiskt med alla beräkningar.
    • Programmera summan av den sista kolumnen. Du behöver summan av artiklarna i kolumnen "Produkt". Skriv formeln i den tomma cellen direkt under den sista datapunkten i den kolumnen: = SUM (E2: E ___). Fyll det tomma utrymmet med celladressen till den sista datapunkten.
      • I exemplet med 100 datapunkter går denna formel till cell E103. Typ: = SUMMA (E2: E102).
    • Bestäm kovariansen. Du kan också låta Excel utföra den slutliga beräkningen åt dig. Den sista beräkningen i cell E103 i vårt exempel representerar täljaren för kovariansformeln. Skriv formeln precis nedanför cellen: = E103 / ___. Fyll det tomma utrymmet med antalet datapunkter du har. I vårt exempel är detta 100. Resultatet är din kovarians.

Metod 3 av 4: Använda kovariansräknare online

  1. Sök online efter kovariansräknare. Olika skolor, företag eller andra källor har webbplatser som beräknar kovariansvärdena mycket enkelt för dig. Använd söktermen "kovariansräknare" i en sökmotor.
  2. Ange dina uppgifter. Läs instruktionerna på webbplatsen noggrant för att se till att du anger informationen korrekt. Det är viktigt att dina datapar hålls i ordning, annars blir det genererade resultatet en felaktig kovarians. Webbplatser har olika stilar för datainmatning.
    • På webbplatsen http://ncalculators.com/statistics/covariance-calculator.htm finns till exempel en horisontell ruta för inmatning av x-värden och en andra horisontell ruta för inmatning av y-värden. Du måste ange dina data åtskilda med komma. Således bör x-datauppsättningen som beräknats tidigare i den här artikeln anges som 1,3,2,5,8,7,12,2,4. Y-data som 8,6,9,4,3,3,2,7,7.
    • På en annan webbplats, https://www.thecalculator.co/math/Covariance-Calculator-705.html, kommer du att bli ombedd att ange x-data i den första rutan. Data matas in vertikalt med ett objekt per rad. Därför ser posten på denna webbplats ut som:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Beräkna dina resultat. Det attraktiva med dessa onlineberäkningar är att efter att du har angett data behöver du vanligtvis bara klicka på "Beräkna" -knappen så visas resultaten automatiskt. De flesta webbplatser ger dig mellanberäkningarna av x (avg), y (avg) och n.

Metod 4 av 4: Tolka resultaten av kovariansen

  1. Leta efter en positiv eller negativ relation. Kovariansen är ett enda statistiskt tal som anger förhållandet mellan en datamängd och en annan. I exemplet som nämns i inledningen mäts höjd och vikt. Man kan förvänta sig att när människor växer kommer deras vikt också att öka, vilket leder till en positiv kovarianssyn. Ett annat exempel: Antag att data samlas in som anger antalet timmar någon tränar golf och den poäng han eller hon uppnår. I det här fallet förväntar du dig en negativ kovarians, vilket innebär att när antalet träningstimmar ökar kommer golfpoängen att minska. (I golf är en lägre poäng bättre).
    • Tänk på provuppsättningen som beräknats ovan. Den resulterande kovariansen är -8,07. Minustecknet betyder att när x-värdena ökar tenderar y-värdena att minska. Du kan se att detta är sant genom att titta på några av värdena. Exempelvis motsvarar x-värdena 1 och 2 y-värdena 7, 8 och 9. X-värdena 8 och 12 är kopplade till y-värdena 3 respektive 2 .
  2. Tolk storleken på kovariansen. Om antalet kovarianspoäng är stort, antingen ett stort positivt tal eller ett stort negativt tal, kan du tolka detta som två dataelement som är starkt kopplade, antingen på ett positivt eller negativt sätt.
    • Kovariansen i -8.07 för datamängden är ganska stor. Observera att data sträcker sig från 1 till 12. Så 8 är ett ganska stort antal. Detta indikerar en ganska stark relation mellan datamängderna x och y.
  3. Förstå bristen på en relation. Om ditt resultat är en kovarians som är lika med eller mycket nära 0 kan du dra slutsatsen att datapunkterna inte är relaterade. Det vill säga en ökning av det ena värdet kan, men behöver inte resultera i en ökning av det andra värdet. De två termerna är länkade nästan slumpmässigt.
    • Antag att du relaterar skostorlekar till examenbetyg. Eftersom det finns så många faktorer som påverkar studentens examensbetyg kan man förvänta sig en kovarianspoäng nära 0. Detta indikerar att det nästan inte finns något samband mellan de två värdena.
  4. Se förhållandet grafiskt. För att visuellt förstå kovarians kan du rita dina datapunkter i ett x, y-diagram. När du gör det borde du se ganska enkelt att punkterna, även om de inte är precis i en rak linje, tenderar att närma sig ett kluster i en diagonal linje uppifrån till vänster till nedre höger. Detta är beskrivningen av en negativ kovarians. Du kan också se att värdet på kovariansen är lika med -8.07. Detta är ett ganska stort antal jämfört med datapunkterna. Det höga antalet antyder att kovariansen är ganska stark, vilket du kan härleda från datapunkternas linjära form.
    • För att gå igenom detta igen, läs artiklar om ritpunkter i ett koordinatsystem på wikiHow.

Varningar

  • Covariance har begränsad tillämpning inom statistik. Det är ofta ett steg mot beräkning av korrelationskoefficienter eller andra begrepp. Var försiktig med alltför djärva tolkningar baserat på en kovarianspoäng.