Bestäm korrelationskoefficienten

Författare: Morris Wright
Skapelsedatum: 28 April 2021
Uppdatera Datum: 19 Juni 2024
Anonim
Bestäm korrelationskoefficienten - Råd
Bestäm korrelationskoefficienten - Råd

Innehåll

Korrelationskoefficienten, betecknad r eller ρ, är måttet på den linjära korrelationen (förhållandet, både i styrka och riktning) mellan två variabler. Det sträcker sig från -1 till +1, med plus- och minustecken för att representera den positiva och negativa korrelationen. Om korrelationskoefficienten är exakt -1, är förhållandet mellan de två variablerna helt negativt. om korrelationskoefficienten är exakt +1, är förhållandet helt positivt. Två variabler kan ha en positiv korrelation, en negativ korrelation eller ingen korrelation alls. Du kan beräkna korrelationen för hand, med hjälp av några av de gratis korrelationsberäkningarna som finns tillgängliga online, eller genom att använda de statistiska funktionerna i en bra grafkalkylator.

Att gå

Metod 1 av 4: Beräkna korrelationskoefficienten för hand

  1. Samla först in dina uppgifter. För att börja beräkna en effektiv korrelation, först undersöka dataparen. Det är användbart att lägga dem i ett bord, både vertikalt och horisontellt. Märk varje rad eller kolumn x och y.
    • Antag till exempel att du har fyra datapar för X och y. Tabellen kan då se ut så här:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Beräkna medelvärdet av X. För att beräkna medelvärdet behöver du alla värden på X lägg till och dela sedan med antalet värden.
    • Lägg märke till att du har fyra värden för med hjälp av exemplet ovan X. För att beräkna medelvärdet lägger du till alla värden X och dela den med 4. Beräkningen ser ut så här:
    • μX=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}Hitta medelvärdet av y. Till genomsnittet av y För att hitta det följer du samma steg, lägger till alla värdena på y och delar sedan med antalet värden.
      • I exemplet ovan har du också fyra värden för y. Lägg till alla dessa värden och dela dem sedan med 4. Beräkningarna kommer att se ut så här:
      • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}Bestäm standardavvikelsen för X. När du väl har lyckats kan du beräkna standardavvikelsen. Använd formeln för att göra detta:
        • σX=1n1Σ(XμX)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}Beräkna standardavvikelsen för y. Hitta samma standardavvikelse med samma grundsteg y. Du kommer att använda samma formel och använda datapunkterna för y.
          • Med exempeldata kommer dina beräkningar att se ut så här:
          • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}Granska grundformeln för att bestämma en korrelationskoefficient. Formeln för beräkning av en korrelationskoefficient använder medel, standardavvikelser och antalet par i en datamängd (representerad av n). Själva korrelationskoefficienten representeras av små bokstäver r eller den grekiska bokstaven ρ (rho). För den här artikeln kommer vi att använda formeln känd som Pearson-korrelationskoefficienten enligt nedan:
            • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } höger) * vänster ({ frac {y- mu _ {y}} { sigma _ {y}}} höger)}Bestäm korrelationskoefficienten. Du har nu medel och standardavvikelser för dina variabler, så att du kan gå vidare till korrelationskoefficientformeln. Kom ihåg det n representerar antalet värden du har. Du har redan utarbetat annan relevant information i stegen ovan.
              • Med hjälp av provdata kan du ange data i formel för korrelationskoefficient och beräkna dem enligt följande:
              • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } höger) * vänster ({ frac {y- mu _ {y}} { sigma _ {y}}} höger)}Tolk resultatet. För denna datamängd är korrelationskoefficienten 0,988. Detta nummer berättar om två saker om data. Titta på tecknet på numret och storleken på numret.
                • Eftersom korrelationskoefficienten är positiv kan du säga att det finns en positiv korrelation mellan x-data och y-data. Det betyder att om x-värdena ökar förväntar man sig att y-värdena ökar också.
                • Eftersom korrelationskoefficienten är mycket nära +1 är x-data och y-data mycket nära relaterade. Om du skulle rita dessa punkter skulle du se att de är en mycket bra approximation till en rak linje.

Metod 2 av 4: Använda online korrelationsräknare

  1. Sök online efter korrelationsräknare. Att mäta korrelation är en ganska standardberäkning för statistiker. Beräkningen kan bli mycket tråkig för stora datamängder om den görs för hand. Därför har många källor gjort vanliga korrelationsberäkningar tillgängliga online. Använd valfri sökmotor och ange söktermen "korrelationsräknare".
  2. Ange data. Läs instruktionerna på webbplatsen noggrant så att du kan ange informationen korrekt. Det är viktigt att datapar hålls i ordning eller så får du ett felaktigt korrelationsresultat. Olika webbplatser använder olika format för att mata in data.
    • Till exempel på webbplatsen http://ncalculators.com/statistics/correlation-coefficient-calculator.htm hittar du en horisontell ruta för inmatning av x-värden och en andra horisontell ruta för inmatning av y-värden. Du anger villkoren, separerade endast med komma. Således bör x-datauppsättningen som beräknats tidigare i denna artikel anges som 1,2,4,5. Datamängden y anges som 1,3,5,7.
    • På en annan webbplats, http://www.alcula.com/calculators/statistics/correlation-coefficient/, kan du ange data horisontellt eller vertikalt, så länge du håller datapunkterna i ordning.
  3. Beräkna resultaten. Dessa beräkningsplatser är populära eftersom du vanligtvis bara behöver klicka på "Beräkna" -knappen efter att du har angett data - resultatet visas automatiskt.

Metod 3 av 4: Använda en grafkalkylator

  1. Ange dina uppgifter. Aktivera statistikfunktionen på din grafräknare och välj sedan kommandot "Redigera".
    • Varje miniräknare har lite olika tangentkommandon. Den här artikeln innehåller specifika instruktioner för Texas Instruments TI-86.
    • För att komma åt Stat-funktionen, tryck på [2nd] -Stat (ovanför "+" -tangenten) och tryck sedan på F2-Edit.
  2. Ta bort alla gamla lagrade data. De flesta miniräknare behåller de statistiska uppgifterna tills de rensas. För att se till att du inte förväxlar gammal data med ny data bör du först radera all tidigare sparad information.
    • Använd piltangenterna för att flytta markören för att markera kategorin "xStat". Tryck sedan på "Rensa" och "Enter. Detta bör rensa alla värden i xStat-kolumnen.
    • Använd piltangenterna för att markera kategorin "yStat". Tryck på "Rensa" och "Enter" för att också rensa data för den kolumnen.
  3. Ange dina datavärden. Använd piltangenterna för att flytta markören till det första mellanslaget under rubriken xStat. Skriv in ditt första datavärde och tryck sedan på Enter. Du bör se utrymmet längst ner på skärmen "xStat (1) = __", där ditt värde fyller det tomma utrymmet. När du trycker på Enter kommer data att fylla tabellen, markören flyttas till nästa rad och raden längst ner på skärmen ska nu läsa "xStat (2) = __".
    • Fortsätt att ange alla x-värden.
    • När du har angett x-värdena, använd piltangenterna för att flytta till kolumnen yStat och ange y-värdena.
    • När alla data har matats in, tryck på Avsluta för att rensa skärmen och avsluta Stat-menyn.
  4. Beräkna linjär regressionsstatistik. Korrelationskoefficienten är ett mått på hur nära uppgifterna approximerar en rak linje. En grafräknare med statistiska funktioner kan beräkna den bästa passningslinjen och korrelationskoefficienten mycket snabbt.
    • Gå in i Stat-funktionen och tryck sedan på Calc-knappen. På TI-86 är detta [2nd] [Stat] [F1].
    • Välj linjära regressionsberäkningar. På TI-86 är detta [F3], märkt "LinR." Grafikdisplayen visar sedan raden "LinR _" med en blinkande markör.
    • Du måste nu ange namnen på de två variablerna du vill beräkna. Dessa är xStat och yStat.
      • På TI-86 väljer du namnlistan ("Namn") genom att trycka på [2] [Lista] [F3].
      • Den nedre raden på skärmen ska nu visa tillgängliga variabler. Välj [xStat] (detta är förmodligen F1 eller F2-knappen), ange sedan ett kommatecken och sedan [yStat].
      • Tryck på Enter för att beräkna data
  5. Tolka resultaten. När du trycker på Enter beräknar räknaren omedelbart följande information för de uppgifter du angav:
    • y=a+bX{ displaystyle y = a + bx}Förstå begreppet korrelation. Korrelation avser det statistiska sambandet mellan två kvantiteter. Korrelationskoefficienten är ett enda tal som du kan beräkna för två uppsättningar datapunkter. Siffran är alltid något mellan -1 och +1 och anger hur nära de två datamängderna är.
      • Till exempel, om du mätte höjden och åldern hos barn upp till cirka 12 år, skulle du förvänta dig en stark positiv korrelation. När barnen blir äldre tenderar de att bli högre.
      • Ett exempel på en negativ korrelation är att jämföra den tid någon spenderar på att träna golf med den personens golfpoäng. När övningen fortskrider bör poängen sjunka.
      • I slutändan skulle du förvänta dig lite samband, till exempel positivt eller negativt, mellan en persons skostorlek till exempel och deras examensbetyg.
    • Beräkna medelvärdet. Det aritmetiska medelvärdet, eller "medelvärdet", för en uppsättning data beräknas genom att lägga till alla värden för datan och sedan dividera med antalet värden i uppsättningen. För att bestämma korrelationskoefficienten för dina data måste du beräkna genomsnittet för varje datauppsättning.
      • Medelvärdet för en variabel indikeras av variabeln med en horisontell linje ovanför. Detta kallas ofta för "x-bar" eller "y-bar" för datamängderna x och y. Alternativt kan medelvärdet betecknas med den grekiska bokstaven μ (mu). Om du till exempel vill ange medelvärdet för datapunkterna på x kan du använda μX eller μ (x).
      • Om du till exempel har en uppsättning x (1,2,5,6,9,10) beräknas genomsnittet av dessa data enligt följande:
        • μX=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}Känn vikten av standardavvikelsen. I statistiken mäter standardavvikelsen variationen och visar spridningen av siffrorna från medelvärdet. En grupp siffror med låg standardavvikelse ligger ganska nära varandra. En grupp siffror med hög standardavvikelse är mer spridda.
          • Som en symbol uttrycks standardavvikelsen med små bokstäver s eller den grekiska bokstaven σ (sigma). Således skrivs standardavvikelsen för x-data som sX eller σX.
        • Känn igen summeringsnotationen. Summationsoperatören är en av de vanligaste operatörerna i matematik, och den anger en summa av värden. Det representeras av den grekiska versalen, sigma eller ∑.
          • Om du till exempel har en samling datapunkter x (1,2,5,6,9,10) betyder ∑x:
            • 1+2+5+6+9+10 = 33

Tips

  • Korrelationskoefficienten kallas ibland "Pearson produkt-moment korrelationskoefficient" till ära för Karl Pearson, dess utvecklare.
  • I allmänhet representerar en korrelationskoefficient högre än 0,8 (positiv eller negativ) en stark korrelation; en korrelationskoefficient lägre än 0,5 (positiv eller negativ igen) representerar en svag korrelationskoefficient.

Varningar

  • Korrelation visar att två datamängder är anslutna på något sätt. Var dock försiktig så att du inte tolkar detta som ett orsakssamband. Om du till exempel jämför människors skostorlekar och deras längd kommer du sannolikt att hitta en stark positiv korrelation. Större människor har i allmänhet större fötter. Det betyder dock inte att du blir lång kommer att få dina fötter att växa, eller att stora fötter får dig att växa lång. De händer bara tillsammans.